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译 者 F 


操作 系统 是 计算 机 最 重要 的 系统 软件 ,是 计算 机 应 用 的 基础 。Unix 系统 是 迄今 最 优秀 
的 操作 系统 , 虽 历 经 几 十 年 ,有 许多 变化 ,但 基本 的 体系 结构 保持 稳定 。 更 难能可贵 的 是 ,在 
计算 机 发 展 如 此 迅速 的 今天 ,Unix 系统 仍 以 其 安全 、 稳 定 及 强大 的 处 理 能 力 , 仍 为 最 主要 的 
操作 系统 ,计算 机 技术 发 展 到 今天 ,很 多 关键 应 用 还 依赖 于 Unix 系统 。 

本 书 从 解释 Unix 的 工作 原理 .讲解 系统 命令 的 功能 人 手 , 由 浅 入 深 , 抽 丝 剥 草 般 地 将 
Unix 系统 的 实现 机 理 逐 渐 展示 给 读者 ,同时 针对 不 同 的 实现 方法 展开 了 深入 的 讨论 。 书 中 
用 大 量 的 篇 幅 剖 析 了 多 个 Unix 系统 命令 的 实现 方法 ,循序 渐进 地 让 读者 理解 并 逐步 精通 
Unix 系统 编程 ,进而 具有 编制 Unix 应 用 程序 的 能 力 。 书 中 采用 启发 式 、 举 一 反 三 、 类 比分 
析 、 图 示 讲解 等 多 种 方法 讲授 ,语言 生动 .结构 合理 .易于 理解 。 每 一 章 后 均 附 有 大 量 的 习题 
和 编程 练习 ,读者 可 以 参考 练习 。 本 书 十 分 适合 初学 者 阅读 ,各 章 总 是 先 给 出 一 个 最 简单 的 
例子 ,然后 不 断 地 加 入 新 的 特性 ,最 终 达 到 实用 的 程度 。 通 过 这 种 方法 ,使 读者 对 系统 的 理 
解 逐 步 深信。 但 这 并 不 影响 本 书 的 深度 , 书 中 涉及 了 很 多 Unix 的 高 级 特性 ,并 进行 了 深入 
浅 出 .和 人 木 三 分 的 分 析 ,相信 资深 的 开发 人 员 也 能 够 从 中 获 益 。 

本 书 适合 作为 高 等 院 校 计 算 机 及 相关 专业 的 教材 和 教学 参考 书 , 亦 可 作为 有 一 定 系 统 
编程 基础 的 开发 人 员 的 自学 教材 和 参考 手册 。 

在 本 书 的 翻译 过 程 中 , 除 杨 宗 源 、 黄 海 涛 外 , 知 海 明 . 朱 羚 . 徐 国庆 、 莫 杰 众 . 李 唱 、 陈 玲 、 
许 峰 兵 . 查 冰 等 也 参与 了 部 分 翻译 和 校对 工作 。 限 于 译 者 的 水 平 , 译 文中 定 有 错误 和 不 妥 之 
处 , 恩 请 读者 指正 。 


译 者 
2004 年 2 AFEN 
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理解 Unix 编程 


XT Unix 
写作 本 书 的 目的 是 解释 Unix 的 工作 原理 以 及 如 何 编写 Unix 系统 程序 。Unix 诞生 30 
年 来 ,至 今 仍 在 进行 着 不 断 的 改进 ,并 且 变 得 越 来 越 复杂 。 但 它 并 未 因此 而 难以 理解 ,最 初 
的 基本 结构 和 设计 原则 仍然 适用 。 通 过 理解 它 的 结构 、 原 理 和 历史 ,读者 可 以 阅读 、 加 强 和 
增添 不 断 积累 起 来 的 巨大 的 Unix 程序 库 。 同 时 ,在 这 个 过 程 中 ,相信 读者 也 可 以 感受 到 许 
为 了 使 讲解 更 加 清晰 明了 , 书 中 采用 了 图 片 、 类 推 、 伪 代码 、 源 代码 、 实 验 、 练 习 和 特性 点 
等 多 种 形式 。 而 且 这 些 讲解 内 容 都 是 从 实际 的 问题 和 项 目 中 提炼 出 来 的 。 


”本 书 的 适用 对 象 


阅读 本 书 的 读者 要 有 一 定 的 C 语言 基础 。 如 果 已 经 学 过 C++ ,理解 书 中 的 代码 将 会 更 
加 容易 ,并 会 很 快 适 应 本 书 。 读 者 应 该 了 解数 组 结构、 指针 和 链表 的 概念 ,并 具有 用 它们 阅 
读 和 编写 程序 的 能 力 。 

但 这 里 并 不 要 求 读者 用 过 Unix, 也 不 要 求 读者 了 解 操 作 系 统 的 内 核 原理 。 在 每 一 章 的 
开头 都 首先 讲解 Unix 的 用 户 级 特性 。 通 过 “该 命令 有 什么 功能 ?” 这 个 问题 很 自然 地 将 读者 
引 癌 了 为 外 一 个 系统 级 的 问题 “该 功能 是 如 何 实现 的 ?”。 

学 习 过 程 中 ,需要 谈 者 登录 Unix 系统 并 亲 日 做 一 些 实验 。 


可 以 学 到 什么 

书 中 介绍 了 Unix 系统 的 组 成 部 分 ,并 讲解 了 它们 的 功能 .工作 原理 及 如 何 使 用 它们 进 
行 编程 。 在 这 个 过 程 中 ,读者 还 可 以 领悟 到 这 些 组 件 是 怎样 组 合成 这 个 统一 .智能 的 操作 系 
统 的 。 l 

本 书 源 于 我 从 1990 年 开始 在 蛤 佛 大 学 职业 教育 学 院 (Harvard Extension School) 执教 
的 一 门 课程 一 一 Unix 系统 编程 。 在 课程 评估 和 毕业 几 年 后 学 生 给 我 发 来 的 邮件 中 ,学 生 们 
回 我 描述 了 他 们 在 这 门 课 中 学 到 的 东西 ,一 个 学 生 说 这 门 课 给 了 他 ”“ 通 往 国王 宝座 的 钥匙 ”。 
无 论 用 户 级 .系统 级 还 是 理论 级 ,他 对 Unix 都 有 了 很 好 的 理解 ,他 觉得 他 已 经 可 以 应 对 各 个 
方面 的 情况 ,并 可 以 解决 所 碰 到 的 大 多 数 问题 。 还 有 一 个 学 习 过 这 门 课程 的 内 科 医 生 , 他 说 
他 很 喜欢 这 种 实例 教学 法 ,并 将 其 比 作 见 习 医 生 在 医院 里 通过 实际 病例 来 学 习 。 

还 有 一 个 毕业 后 在 开放 软件 公司 担任 项 目 主 管 的 学 生 说 ,这 门 课 使 他 掌握 了 他 在 工作 
中 所 需 的 知识 和 技能 。 
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适用 的 Unix 版 本 

本 书 适用 于 包括 GNU 和 Linux 在 内 的 几乎 所 有 的 Unix 版 本 。 书 中 重点 讲述 构成 所 有 
Unix 版 本 基础 的 结构 和 技能 ,而 不 是 随 各 个 版 本 变化 的 具体 细节 。 只 要 掌握 了 这 些 基本 知 
识 ,那些 细节 的 学 习 将 会 很 容易 上 手 。 | 
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概念 

。 Unix 系统 包含 用 户 程序 和 系统 内 核 

。 内 核 由 多 个 子 系统 构成 

。 内 核 管理 所 有 的 程序 和 资源 

。 进程 之 间 的 通信 对 Unix 程序 是 很 重要 的 
。 什么 是 系统 编程 

相关 命令 

* bc 


* more 


IT 3T 2H 


什么 是 系统 编程 ”什么 是 Unix 系统 编程 ? 本 书 具 体会 涉及 哪些 知识 ? 本 章 力图 回答 
上 述 问题 。 

首先 从 分 析 操 作 系 统 的 职责 入 手 , 来 解释 如 何 编写 与 操作 系统 紧密 相关 的 程序 。 然 后 
通过 分 析 标 准 的 Unix 命令 ,以 及 它们 用 到 的 系统 调用 ,进一步 指导 读者 自己 编程 实现 相应 
的 功能 。 这 一 章 的 最 后 会 通过 一 幅 图 来 描述 Unix 系统 。 本 书 的 主要 学 习 形式 就 是 通过 图 
示 和 剖析 文中 程序 所 涉及 的 命令 、 技 术 , 进 而 实现 系统 编程 。 


1.2 什么 是 系统 编程 
1.2.1 简单 的 程序 模型 


你 可 能 写 过 各 种 各 样 的 程序 ,有 科学 计算 方面 的 ,金融 方面 的 .图 像 方面 的 ,文字 处 理 方 
面 的 等 。 大 部 分 的 程序 都 是 基于 以 下 模型 ,如 图 1. 1 所 示 。 





图 1.1 计算 机 中 的 程序 
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在 这 个 模型 中 ,程序 就 是 可 以 在 计算 机 上 运行 的 一 段 代码 ,程序 把 输入 数据 做 相应 
后 输出 。 例 如 用 户 在 键盘 上 输入 数据 ， ile! Nokon siege i 
可 能 会 用 到 打印 机 。 
遵循 上 述 模型 ,看 以 下 代码 : 


/* copy from stdin to stdout x/ 
main() 
( 
int c; 
while( ( c = getchar() ) != EOF ) 
putchar(c); 
) 


这 段 代码 对 应 图 1.2 所 示 的 模型 。 





"etta () 
图 1.2 程序 的 输入 1 输出 


在 图 1. 2 中 键盘 和 显示 器 与 程序 直接 相连 。 在 简单 的 个 人 计算 机 中 ,实际 情况 是 很 类 似 
的 ,键盘 和 显示 卡 直接 连 到 计算 机 的 主板 上 ,CPU 和 内 存 也 是 通过 揪 槽 直接 连 在 主板 上 , 它 
们 通过 主板 上 的 印刷 线路 , 连 为 一 体 。 如果 能 够 打开 机 箱 ,所 看 到 的 大致 如 此 。 


1.2.2 系统 模型 
如 果 所 使 用 的 系统 是 一 个 多 用 户 系统 ,如 典型 的 Unix 系统 , 那 会 是 一 副 怎样 的 情形 呢 ? 





图 1.3 多 个 用 户 ,程序 和 设备 
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刚才 的 简单 模型 已 经 不 适用 ,图 1. 3 会 更 接近 一 些 。 

在 这 个 系统 中 有 多 个 用 户 同时 运行 多 个 程序 ,可 能 需要 访问 多 个 设备 。 

虽然 模型 复杂 了 ,但 对 程序 而 言 , 它 还 是 从 键盘 得 到 数据 ,将 结果 显示 在 显示 器 上 ,也 可 
以 对 磁盘 读 写 ,这 些 操作 都 没有 任何 问题 , 它 使 用 的 还 是 简单 模型 。 

接 下 来 考虑 一 种 更 为 复杂 的 情况 ,有 许多 键盘 /显示 器 ,它们 可 以 随意 地 连接 到 不 同 的 
程序 ,随意 地 操作 它们 ,这 种 情况 如 图 1.4 ra. 





图 1.4 终端 可 以 随意 地 连接 到 程序 
实际 上 ,在 计算 机 内 部 ,这 种 随意 的 连接 是 不 允许 的 ,必须 采用 一 种 机 制 进 行 管理 。 


1.2.3 操作 系统 的 职责 


计算 机 用 操作 系统 来 管理 所 有 的 资源 ,并 将 不 同 的 设备 和 不 同 的 程序 连接 起 来 。 从 连 
接 的 角度 来 讲 ,操作 系统 的 作用 就 像 主板 上 的 印刷 线路 一 样 。 
有 了 操作 系统 以 后 ,图 1.4 的 混乱 状态 就 可 以 得 到 改变 ,新 的 模型 如 图 1. 5 所 示 。 


用 户 空 间 


系统 空间 





图 1.5 操作 系统 是 一 个 特殊 的 程序 


操作 系统 也 是 程序 ,与 普通 程序 一 样 ,也 运行 在 内 存 中 ,同时 它 又 是 一 个 特殊 的 程序 , 它 
能 把 普通 程序 与 其 他 程序 或 设备 连接 起 来 。 
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1.2.4 为 程序 提供 服务 


现在 的 问题 (系统 中 的 多 个 用 户 和 程序 是 如 何 连接 起 来 的 ) 和 大 致 的 解决 办 法 (通过 一 
个 管理 程序 ) 已 经 很 清楚 了 , 接 下 来 看 具体 的 解决 方案 。 

首先 要 解释 一 些 术语 ,内 存 空间 用 来 存放 程序 和 数据 ,就 像 古 雅典 人 腾 出 空间 来 放 衣 服 
一 样 ,所 有 的 程序 都 必须 在 内 存 空间 中 才能 运行 ,用 来 容纳 操作 系统 的 内 存 空间 叫做 系统 空 
[8] ,容纳 应 用 程序 的 内 存 空 间 叫 做 用 户 空间 。 

操作 系统 也 被 称 为 内 核 ,' 有 了 内 核 的 概念 后 ,再 来 看 计算 机 系统 的 连接 情况 ,如 图 1.6 
所 示 。 





图 1.6 内 核 管理 计算 机 系统 的 连接 


注意 ,在 图 1.6 中 可 以 发 现 , 程 序 要 访问 设备 (如 键盘 、 磁 盘 和 打印 机 ) 必 须 通 过 内 核 , 所 
以 只 有 内 核 才能 直接 管理 设备 。 

程序 如 果 要 从 键盘 得 到 数据 ,必须 向 内 核发 出 请 求 , 若 在 显示 器 上 显示 结果 ,也 要 通过 
内 核 ,程序 中 所 有 对 设备 的 操作 都 是 通过 内 核 进行 的 。 

图 1. 6 中 的 线 是 内 核 提 供 的 虚拟 连接 线 , 内 核 向 程序 提供 服务 以 便 程 序 能 够 访问 到 设备 。 

解释 了 这 些 内 容 后 ,再 来 看 什么 是 系统 编程 :编写 普通 程序 时 可 以 认为 ,程序 是 直接 连 
到 键盘 、 显 示 器 ,磁盘 等 设备 的 ,但 在 进行 系统 编程 时 ,必须 对 系统 的 结构 和 工作 方式 有 更 深 
的 了 解 , 要 知道 内 核 提供 哪些 服务 (系统 调用 ) ,如 何 使 用 它们 ,系统 有 了 哪些 资源 和 设备 ,不 同 
的 资源 和 设备 该 如 何 操作 。 


1.3 理解 系统 编程 


内 核 提 供 服务 以 便 系 统 程序 可 以 直接 访问 系统 资源 ,那么 有 哪些 系统 资源 和 服务 呢 ? 
1.3.1 系统 资源 


1. 处 理 器 (Processor) 
程序 是 由 指令 构成 的 ,处 理 器 是 执行 指令 的 硬件 设备 ,一 个 系统 中 可 能 有 多 个 处 理 器 。 
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内 核能 够 安排 一 个 程序 何 时 开始 执行 , 何 时 暂时 停止 .恢复 执行 , 何 时 终止 执行 。 

2. 输入 输出 (1/0O) 

程序 中 所 有 输入 /输出 的 数据 .终端 的 输入 /输出 数据 还 有 硬盘 输入 /输出 数据 ,都 必须 
流 经 内 核 ,这 种 集中 的 处 理 方 式 有 以 下 优点 : 正确 性 ,数据 流 不 会 流 错 地 方 ; 有效 性 ,程序 员 
无 需 考虑 不 同 设备 之 间 的 差异 ; 安全 性 ,数据 信息 不 会 被 未 被 授权 的 程序 非法 访问 。 

3、 进 程 管理 (Process Management) 

进程 指 程序 的 一 次 运行 ,每 个 进程 都 有 自己 的 资源 ,如 内 存 、 打 开 的 文件 和 其 他 运行 时 
所 需 的 系统 资源 。 内 核 中 与 进程 相关 的 服务 有 新 建 一 个 进程 .中止 进程 .进程 调度 等 。 

4. AË (Memory) 

内 存 是 计算 机 系统 中 很 重要 的 资源 ,程序 必须 被 装载 到 内 存 中 才 可 以 运行 。 内 核 的 职 
责 之 一 是 内 存 管理 ,在 需要 的 时 候 给 程序 分 配 内 存 , 当 程序 不 需要 的 时 候 回 收 内 存 , 内 核 还 
能 够 保证 内 存 不 被 其 他 的 进程 非法 访问 。 

9. 1&4 (Device) 

计算 机 系统 中 可 以 有 各 种 各 样 的 外 设 , 如 磁带 机 、 光 驱 、 鼠 标 、 扫 描 仪 和 数码 摄像 机 等 ， 
它们 的 操作 方式 各 不 相同 ,内 核能 屏蔽 掉 这 种 差异 ,使 得 对 设备 的 操作 方式 简单 而 统一 。 例 
如 ,一 个 程序 想 要 从 数码 照相 机 中 取出 照片 存储 在 计算 机 中 , 它 只 需 向 内 核 提 出 操作 该 资源 
的 请 求 即 可 。 

6. 计时 器 (Timers) 

程序 的 工作 与 时 间 有 关 , 有 的 需要 定时 被 触发 ,有 的 需要 等 一 段 时 间 再 开始 某 个 动作 ， 
“有 的 需要 知道 某 一 个 操作 消耗 的 时 间 , 这 些 都 涉及 计时 器 ,内 核 可 以 通过 系统 调用 向 应 用 程 
序 提供 计时 器 服务 。 

7. 进程 间 通 信 (Iinterprocess Communication) 

在 现实 生活 中 人 们 通过 电话 ,email 信件、 广播 .电视 等 互相 通信 ,在 计算 机 的 世界 中 ， 
不 同 的 进程 也 需要 互相 通信 ,内 核 提 供 的 服务 使 进程 间 通 信 成 为 可 能 。 就 像 电 信和 邮政 提 
供 的 服务 ,通信 也 是 资源 。 

8. W 4 (Networking) 

网 络 之 间 的 通信 可 以 看 作 是 进程 间 通信 的 特殊 形式 ,通过 网 络 , 不 同 主 机 上 的 进程 , 即 
使 使 用 的 是 不 同 操作 系统 ,也 可 以 互相 通信 。 网 络 通信 也 是 内 核 提供 的 服务 。 


1.3.2 目标 : 理解 系统 编程 


刚才 已 经 简单 介绍 了 内 核 所 提供 的 各 种 类 型 的 服务 ,各 种 内 核 服 务 具体 有 什么 特点 ,会 
用 到 哪些 设备 ,需要 哪些 参数 ,会 提供 哪些 数据 , 接 下 来 的 目标 是 掌握 内 核 服 务 的 机 制 ,以 便 
在 自己 的 程序 中 使 用 这 些 服 务 。 


1.3.3 方法 : 通过 三 个 问题 来 理解 
本 书 通 过 以 下 3 个 步骤 来 学 习 。 
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1. 分 析 程 序 

首先 分 析 现 有 的 程序 ,了 解 它 的 功能 及 实现 原理 。 

2. 学 习 系 统 调用 

看 程序 都 用 到 哪些 系统 调用 ,以 及 每 个 系统 调用 的 功能 和 使 用 方法 。 
3. 编程 实现 

利用 学 到 的 原理 和 系统 调用 ,自己 编程 实现 原来 程序 所 实现 的 功能 。 
以 上 3 步 可 以 通过 下 面 3 个 问题 来 实现 : 

。 它 能 做 什么 ? 

© 它 是 如 何 实现 的 ? 

。 能 不 能 自己 编写 一 个 ? 


1.4 从 用 户 的 角度 来 理解 Unix 
1.4.1 Unix 能 做 些 什么 


要 学 习 Unix 系统 编程 ,首先 看 看 Unix 能 做 些 什么 。 下 面 从 一 个 从 终端 登录 到 系统 中 
的 普通 用 户 的 角度 来 看 Unix 是 什么 , 它 能 做 些 什么 ， 


1.4.2 登录 一 运行 程序 一 注销 


使 用 Unix 的 过 程 一 般 如 下 : 登录 到 系统 中 ,运行 程序 ,工作 结束 后 再 注销 。 登 录 的 时 候 
要 输入 用 户 名 和 和 密码， 


Linux 1.2.13 (maya) (ttypl) 
maya login: betsy 


Password: _ 


登录 到 系统 中 以 后 ,就 可 以 运行 各 种 各 样 的 程序 了 ,比如 收发 邮件 程序 .科学 计算 程序 
以 及 游戏 程序 。 

运行 程序 也 很 简单 , 当 显示 器 上 出 现 提示 符 后 (一 般 是 “$”) ,输入 程序 的 名 字 , 按 回 车 ， 
程序 将 开始 运行 。 运 行 结束 后 ,提示 符 再 次 出 现 。 

图 形 用 户 界 面 的 操作 方式 实际 上 也 是 这 样 的 。 图 标 和 菜单 可 以 看 作 是 提示 符 , 双 击 图 
标 就 像 运行 命令 一 样 , 系 统 会 把 双击 操作 解释 为 相应 程序 的 执行 。 

运行 完 程 序 后 ,可 以 从 系统 中 注销 : 


$ exit 


在 有 些 系统 中 ,可 以 通过 输入 logout 或 按 组 合 键 Ctrl+D IER, 

它 是 如 何 工 作 的 呢 ? 

这 看 起 来 很 简单 ,但 系统 在 内 部 是 如 何 处 理 的 呢 ? 

自 先 来 看 登录 过 程 。 人 们 常 说 使 用 计算 机 就 像 使 用 自己 的 汽车 一 样 ,这 是 个 人 计算 机 
中 的 概念 ,问题 在 于 Unix 允许 许多 用 户 ， 可 能 是 几 十 甚至 几 百 人 ,同时 登录 到 系统 中 ,系统 
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是 如 何 对 这 么 多 的 用 户 进行 管理 的 呢 ? 

在 登录 过 程 中 , 当 用 户 名 和 密码 通过 验证 后 ,系统 会 启动 一 个 叫 shell 的 进程 ,然后 把 用 
户 交 给 这 个 进程 ,由 这 个 进程 处 理 用 户 的 请 求 。 每 个 用 户 都 有 属于 自己 的 shell 进程 。 

图 1.7 是 用 户 登 录 到 Unix 系统 中 的 示意 图 。 





1.7 用 户 登 录 到 系统 


图 1. 7 中 左边 的 大 盒子 表示 计算 机 系统 , 坐 在 键盘 和 显示 器 前 的 是 用 户 ,计算 机 里 有 内 
存 , 内 核 运 行 在 内 存 中 ,shell 为 用 户 提供 服务 ,shell 和 用 户 之 间 的 连接 由 内 核 控 制 。 

Shell 在 屏幕 上 显示 出 提示 符 , 表 示 现 在 可 以 接收 用 户 的 输入 。 对 于 普通 用 户 而 言 提示 
符 一 般 是 “$”, 也 可 能 还 会 显示 其 他 的 提示 信息 。 用 户 可 以 在 提示 符 后 输入 要 运行 的 程序 的 
名 字 ,内核 负责 把 用 户 的 输入 传 给 shell。 例 如 ,运行 显示 日 期 和 时 间 的 程序 如 下 : 


$ 
S date 
Sat Jul 1 21:34:10 EDT 2000 


$ 


date 命令 显示 出 日 期 , 接 下 来 显示 命令 提示 符 。 
要 运行 其 他 命令 ,只 要 输入 程序 名 即 可 ,Unix 中 有 一 个 程序 fortune, 下 面 是 它 运 行 的 
例子 : 


$ fortune 
Algol- 60 surely must be regarded as the most important 
programming language yet developed. 
—-— T. Cheatham 
$ 


当 用 户 注 销 时 ,内 核 会 结束 所 有 分 配给 这 个 用 户 的 进程 。 
内 核 是 如 何 创 建 shell 进程 的 呢 ? shell 进程 是 如 何 得 到 输入 的 程序 名 ,内 核 又 是 如 何 运 
行程 序 的 呢 ? 登录 系统 和 运行 程序 并 非 想 像 的 那么 简单 。 这 些 细 节 会 在 第 8 章 讨论 。 
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1.4.3 目录 操作 


用 户 登 录 后 ,可 以 对 自己 的 文件 进行 操作 。 文 件 中 可 以 有 e-mail, E Fr . 源 程序 .可 执行 
程序 等 各 种 各 样 的 数据 。 文 件 被 组 织 在 目录 中 。 

1l. 目录 树 

在 Unix 系统 中 ,文件 和 目录 被 组 织 成 树 状 结构 , Unix 提供 相应 的 命令 来 对 目录 进行 
操作 。 

图 1.8 是 一 个 目录 树 的 例子 。 


Fee] [Rm] [we] [ee 


[soot] [cu] [in 
[asses] mpies | | [mar] [a 


图 1.8 目录 树 的 一 部 分 


如 图 1.8 所 示 ,文件 系统 的 最 顶端 是 “/”, 它 叫做 根 自 录 , 根 目录 一 般 都 包含 几 个 子 目录 。 
大 多 数 的 Unix 系统 都 在 根 目 录 下 面 有 /etc、/home、/bin 等 几 个 子 目 录 , 它 们 都 有 特定 的 用 
途 ,比如 大 多 数 的 Unix 用 户 都 有 自己 的 主 目录 ,而 一 般 来 说 用 户主 目录 就 在 /home 目录 中 。 

Unix 系统 中 有 很 多 命令 都 与 目录 有 关 , 如 新 建 目 录 .删除 目录 改变 当前 目录 、 列 出 目录 
内 容 等 , 读 完 本 节 的 内 容 后 可 以 自己 试 一 试 这 些 命令 。 

2. 目录 操作 命令 

(1) ls 列 出 目录 内 容 

ls 命令 的 作用 是 列 出 目录 的 内 容 , 即 当前 目录 里 的 文件 和 子 目 录 , 如 果 只 输入 1s, 那么 列 
出 的 是 当前 目录 的 内 容 , 如 果 输 入 ls dirname, 那 么 列 出 的 是 dirname 所 指定 的 目录 的 内 容 ， 
如 输入 : 





ls /etc 


会 列 出 /etc 目 录 里 面 所 包含 的 文件 和 子 目 录 ,同样 地 A REAL. 


ls / 


则 会 列 出 根 目录 的 内 容 。 

(2) cd 改变 当前 目录 

cd 命令 的 作用 是 改变 当前 的 目录 。 当 刚 刚 登 录 到 系统 中 时 ， 当前 目录 是 自己 的 主 目录 ， 
可 以 通过 cd 命令 转 到 其 他 目录 ,如 : 








第 1 章 Unix 系统 编程 概述 097 


cd /bin 


会 转 到 /bin 目录 下 ,这 个 目录 中 有 很 多 系统 命令 ,可 以 用 ls 查看 有 哪些 命令 。 通 过 下 述 命令 


cd.. 
无 论 当 前 目录 是 什么 ,通过 下 述 命令 都 可 以 立即 回 到 用 户 的 主 目录 : 


cd 


(3) pwd 一 一 显示 当前 目录 | 
pwd 命令 告诉 当前 目录 是 什么 , 它 列 出 的 是 全 路 径 , 即 从 根 目录 开始 的 路 径 ,如 : 


$ pwd 
/home/cse215/samples 


从 上 述 操作 可 以 知道 ,当前 目录 是 通过 从 根 目录 开始 ,依次 进入 home, cse215 , samples 
来 得 到 。 

(4) mkdir .rmdir HE .删除 有 目录 

用 mkdir 来 新 建 目录 ,如 : 





S cd 
$ mkdir jokes 


先进 入 主 目录 ,然后 在 主 目录 中 建立 jokes 这 样 一 个 目录 。 一 般 来 说 ,只 能 在 自己 的 目 
录 中 新 建 目 录 而 不 允许 在 其 他 用 户 的 目录 中 新 建 目 录 。 
要 删除 一 个 已 经 存在 的 目录 ,可 以 用 rmdir 命令 ,如 : 


$ rmdir jokes 


如 果 jokes 目录 是 空 目 录 , 那 这 个 命令 可 以 把 jokes 删除 。 注 意 用 rmdir 来 删除 目录 , 必 
须 先 把 目录 中 的 文件 和 子 目 录 删 除 或 移 走 。 

3. 目录 操作 命令 的 工作 原理 

从 刚才 的 分 析 可 以 知道 硬盘 上 的 目录 和 文件 构成 了 一 棵 目录 树 , 树 的 中 间 结 点 是 目录 ， 
每 个 目录 又 可 以 包含 很 多 的 子 目录 和 文件 ,可 以 新 建 或 删除 目录 ,可 以 从 一 个 目录 转 到 其 他 
的 目录 。 

然而 这 些 是 如 何 工作 的 呢 ? 首先 来 考察 硬盘 ,硬盘 是 由 很 多 片 金属 或 玻璃 的 盘 片 组 合 
起 来 构成 的 ,这 些 盘 片上 可 以 保存 磁性 信息 ,问题 是 目录 在 哪里 ? 用 户 在 自己 的 主 目录 中 意 
味 着 什么 ? 转 到 其 他 目录 又 意味 着 什么 ?” Unix 允许 很 多 用 户 同时 登录 到 系统 中 ,他 们 可 以 
有 相同 的 当前 目录 ,也 可 以 在 不 同 的 目录 中 ,会 不 会 因为 很 多 用 户 在 同一 个 目录 中 导致 这 个 
目录 过 分 拥挤 ? 还 有 的 问题 是 ,如 果 要 自己 来 编写 一 个 改变 当前 目录 的 程序 ,该 如 何 来 实 
现 ?” 内 核 在 这 棵 目录 树 中 扮演 什么 角色 ? 
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1.4.4 文件 操作 


文件 存放 在 目录 中 ,用 户 文件 位 于 用 户 自 己 的 主 目 录 中 ,系统 文件 位 于 系统 目录 中 。 对 
文件 的 操作 有 哪些 呢 ? 

l. 文件 操作 的 命令 

(1) 文件 命名 规则 

每 个 文件 都 有 文件 名 ,在 大 多 数 的 Unix 系统 中 ,文件 名 最 长 可 以 是 250 个 字符 ,很 多 字 
符 都 可 以 出 现在 文件 名 中 ,如 大 小 写字 符 、 标 点 符号 .空格 ,tab, 其 至 回 车 符 , 但 是 不 能 包含 根 
目录 符号 “/”。 

(2) cat,more,less,pg 一 一 -查看 文件 的 内 容 

上 述 命 令 都 可 以 用 来 查看 文件 的 内 容 , 但 也 有 些 细微 的 差别 ,cat 一 下 子 列 出 文件 的 所 有 
内 容 : 


$ cat shopping - list 
soap 

cornflakes 

milk 

apples 

jam 


S 


当 文 件 的 内 容 比较 多 ,在 一 屏 内 显示 不 完 时 ,more 会 更 加 合适 : 


$ more longfile 


显 不 一 屏 后 会 暂停 输出 ,这 时 用 户 按 空格 键 ,more 会 继续 输出 下 导 屏 ,如 果 按 回 车 , 则 会 
显示 下 一 行 ,输入 “q” 则 退出 。 另 外 两 个 命令 less 和 pg 的 功能 与 more 是 类 似 的 。 

(3) cp 文件 复制 

可 以 用 cp 命令 来 复制 文件 ,如 : 





S cp shopping- list last.week.list 


将 文件 shopping - list 复制 一 份 , 新 的 文件 名 为 last. week. list, 
(4) rm 文件 删除 
删除 文件 的 例子 如 下 : 





$ rm old.data junk shopping. june1992 


一 次 删 掉 了 3 个 文件 。 

Unix 并 不 提供 恢复 被 删除 文件 的 功能 ,其 中 一 个 原因 是 Unix 是 一 个 多 用 户 系统 , 当 一 
个 文件 被 删 掉 以 后 , 它 所 占用 的 存储 空间 可 能 被 立即 分 配给 其 他 用 户 的 文件 ,有 可 能 某 块 磁 
盘 空 间 刚才 还 是 你 的 学 期 论文 ,下 一 个 时 刻 就 变 成 了 另外 一 个 用 户 的 C 程序 ,所 以 成 功 恢复 
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的 可 能 性 很 低 。 
(5) mv 一 一 重 命名 或 移动 文件 
mv 命令 可 以 更 改 文件 名 或 动 文件 ,如 





$ mv progl.c first program.c 


将 文件 progl. c 改名 ,新 的 名 字 是 first. program. c, 
也 可 以 移动 文件 , 即 改变 文件 的 位 置 , 如 : 


$ mkdir mycode 
$ mv first program.c mycode 


新 建 一 个 目录 mycode, Ria first. program. c 移动 到 这 个 目录 中 。 
(6) lpr. lp 一 一 打印 文件 
用 lpr 来 打印 文件 ,如 ， 


$ lpr filenane 


上 述 命令 把 filename 送 到 默认 的 打印 机 打印 ,很 多 大 型 系统 有 不 止 一 台 的 打印 机 ,可 以 
通过 lpr 命令 指定 用 哪 一 台 打 印 , 在 有 些 系 统 中 ,可 用 lp 命令 来 完成 ipr 的 工作 。 

2. 文件 操作 命令 的 工作 原理 

从 用 户 的 角度 来 看 ,文件 是 数据 的 集合 ,文件 中 的 数据 是 如 何 存储 在 磁盘 上 的 ? 文件 是 
如 何 被 复制 的 ? 如 何 移动 和 改名 的 ? 进一步 来 讲 , 文 件 的 名 字 存 放 在 哪里 ?作为 一 个 系统 
程序 员 ,必须 能 够 回答 这 些 问 题 ,而 这 些 间 题 的 答案 就 在 Unix RAP, 

3. 文件 许可 权限 

系统 中 每 个 用 户 都 有 自己 的 文件 ,出 于 很 多 原因 ,你 不 会 希望 别 的 用 户 能 够 修改 自己 的 
文件 ,甚至 读 也 不 行 。 系 统 中 有 一 些 管理 命令 ,如 果 使 用 得 不 好 会 对 系统 造成 损害 ,管理 员 
不 希望 普通 用 户 也 有 运行 这 些 命令 的 权力 。 这 些 对 文件 和 命令 操作 的 限制 是 如 何 行使 的 呢 ? 

Unix 通过 一 些 文件 属性 来 对 文件 和 命令 的 操作 进行 控制 。 每 个 文件 都 有 文件 所 有 者 
(owner) 和 文件 许可 权限 。 文 件 所 有 者 指明 了 系统 中 某 一 个 用 户 ,文件 的 创建 者 就 是 文件 所 
有 者 。 

文件 许可 权限 分 为 3 组 ,通过 1s -1 命令 可 以 看 到 : 


$ ls - l outline. 01 
—rwxr-x--- 1 molay users 1064 Jun 29 00.39 outline. 01 


-| 称 为 命令 行 选项 ,选项 -1 使 得 ls 输出 文件 的 详细 信息 。 同 一 个 命令 ,可 以 通过 不 同 
的 选项 ,使 它 所 做 的 工作 稍 有 不 同 。 这 里 的 文件 详细 信息 包含 文件 的 许可 权限 .文件 所 有 
者 、 文 件 长 度 、 最 后 修改 时 间 等 ,其 中 的 “rwxr - x--- ”就 是 文件 许可 权限 。 

每 个 文件 都 有 文件 所 有 者 和 3 组 许可 权限 : 
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一 rwx rwx rwx r,read, w:write, x.execute 


user group other 


£j 3 组 许可 权限 相对 应 ,用户 也 被 分 为 3 组 : user, 文 件 所 有 者 ; group, 与 文件 所 有 者 同 
组 的 用 户 ; other, 其 他 用 户 。 每 组 的 用 户 都 可 以 有 3 种 权限 : 读 权 限 、 写 权限 和 执行 权限 。 
这 样 针 对 不 同 用 户 一 共 是 9 个 权限 ,这些 权 限 可 以 分 别 设 定 , 如 可 以 指定 其 他 用 户 只 能 修改 
文件 而 不 能 读 文件 ,文件 所 有 者 甚至 可 以 取消 自己 读 自 己 文 件 的 权限 。 

4. 文件 许可 权限 的 工作 原理 

文件 许可 权限 是 如 何 工 作 的 ? 怎么 来 设置 ? 系统 是 如 何 应 用 刚才 讲 到 的 权限 的 ? 许可 
权限 存放 在 哪里 ? 在 后 续 的 章节 会 对 这 些 问题 做 解答 。 


1.5 从 系统 的 角度 来 看 Unix 


1.5.1 用 户 和 程序 之 间 的 连接 方式 


前 面 的 小 节 从 用 户 的 角度 来 看 Unix 系统 ,用 户 登 录 到 系统 中 ,运行 程序 ,再 从 系统 中 退 
出 。 与 此 同时 ,可 能 有 很 多 其 他 用 户 也 在 登录 、 运 行程 序 或 退出 系统 ,他 们 可 以 同时 对 一 个 
文件 进行 操作 ,好 像 工 作 在 各 自 独立 的 空间 中 ,他 们 之 间 还 可 以 通过 发 送 e-mail 或 即时 消息 
进行 沟通 。 

其 实 每 个 独立 的 空间 都 是 系统 的 一 部 分 ,从 宏观 的 角度 来 看 ,系统 还 可 能 由 很 多 的 用 
户 、 很 多 程序 ,甚至 很 多 计算 机 系统 互相 连接 而 成 。 接 下 来 ,将 通过 3 个 例子 来 看 系统 是 如 何 
工作 的 ,如 何 编程 使 系统 中 的 不 同 部 分 做 到 协调 统一 。 


1. 5. 2 网 络 桥牌 


许多 人 都 玩 网 络 桥牌 这 个 游戏 ,世界 各 地 的 玩家 通过 计算 机 网 络 连接 到 一 起 ,游戏 开始 
以 后 ,参加 者 就 可 以 看 到 一 个 共同 的 牌 桌 , 能 够 看 到 别人 出 的 牌 ,图 1. 9 是 一 个 简单 的 说 明 。 


af Le 
ER a. 


图 1.9 4 个 人 通过 网 络 打 桥牌 


图 1.9 中 有 4 个 人 ,他 们 每 人 都 有 一 台 计 算 机 ,通过 网 络 连接 在 一 起 。 但 图 1. 9 中 还 少 
THR, PERECHE. mE 1. 10 所 示 。 
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图 1.10 服务 器 上 的 牌 桌 


图 1. 10 中 增加 了 第 5 个 实体 一 一 牌 桌 , 牌 桌 位 于 服务 器 上 ,在 4 个 玩家 的 眼 里 , 牌 是 放 
在 牌 桌 上 的 ,他 们 也 是 通过 牌 桌 才能 够 开始 游戏 。 

在 现实 生活 中 玩 牌 的 时 候 , 人 们 轮流 出 牌 ,但 在 网 络 游戏 中 ,是 由 谁 来 控制 该 哪 一 个 人 
出 牌 ? 牌 又 存放 在 哪里 ? 某 个 人 手中 有 几 张 牌 又 意味 着 什么 ? 如 何 来 保证 不 让 两 个 人 有 同 
一 张 牌 ? 这 在 现实 生活 中 不 会 有 任何 问题 ,但 在 虚拟 的 网 络 中 确实 要 仔细 考虑 。 

图 1.11 显示 了 在 网 络 桥牌 中 的 信息 流 。 


EV 
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图 1.11 分 布 的 程序 向 其 他 用 户 发 送信 息 
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网 络 桥牌 的 例子 展示 了 Unix 系统 编程 中 3 个 重要 的 方面 。 

(1) 通信 | 

某 个 用 户 或 进程 如 何 与 其 他 用 户 或 进程 交换 信息 ? 

(2) 协作 

在 同一 个 时 刻 , 网 络 桥牌 的 两 个 用 户 不 会 都 去 拿 同 一 张 牌 ,程序 如 何 来 协调 多 个 进程 使 
他 们 能 够 没有 冲突 地 访问 共享 资源 ? 

(3) 网 络 访问 

在 这 个 例子 中 ,互相 独立 的 计算 机 通过 网 络 连 接 到 一 起 ,那么 计算 机 中 的 程序 是 如 何 来 
使 用 网 络 的 呢 ? 


1.5.3 bc: Unix 的 计算 器 


Unix 系统 中 的 be 命令 是 执行 一 个 基于 字符 的 计算 器 程序 ,bc 有 两 个 重要 的 特点 , 稍 后 
会 讲 到 。 要 启动 这 个 计算 器 ,只 要 输入 : 
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$ bc 
不 会 有 任何 的 版 本 信息 和 提示 信息 出 现 , 但 这 时 已 经 可 以 接收 输入 了 ,如 : 


2*t*3x4t*5-x10 


bc 会 显示 计算 结果 ,而且 它 知 道 先 做 乘法 再 做 加 法 。 要 退出 bc, 按 Ctrl+D 8. 
bc 的 一 个 重要 特点 是 , 它 可 以 处 理 很 大 的 整数 ,如 : 


99999999999999999999 x 88888888888888888888 
8888888888888888888711111111111111111112 


为 了 得 到 更 大 的 整数 ,可 以 借助 于 大 运算 ， 


3333 ^ 44 
1011006158449564099500589848918228579482240528849807070336511\ 
1794769438904110649252911543814688907219481422090046883818703\ 
5540915541156321805747562427309521 


3333 的 44 次 方 , 得 到 的 整数 足 足 有 两 行 半 那么 长 ,bc 还 是 可 编程 的 ,可 以 定义 变量 ,有 
逻辑 判断 和 循环 结构 ,语法 与 C 语言 类 似 , 如 : 


x = 3 

if (x == 3 )t{ 
y= x * 3; 
} 

Y 


bc 的 另 一 个 重要 特点 是 ,从 严格 的 意义 上 讲 ,bc 并 不 做 任何 计算 。 为 了 说 明 这 一 点 ,做 
如 下 操作 : 


$ bc 
2+ 3 

5 

<- press Ctrl ~ Z here 


Stopped 

$ ps 

PID TTY S TIME CMD 
25102 ttyp2 T 0:00.02 bc 
27081  ttyp2 T 0:00.01 dc - 
27560 ttyp2 I 0:00.59 — bash 
27681 ttyp2 T 0:00.00 be 

$ fg 


«C—- press Ctrl - D here 


ps 命令 可 以 列 出 系统 中 运行 的 所 有 进程 ,这 里 一 共有 4 个 进程 ,除了 两 个 bc 外 ,bash 是 
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shell 进程 ,那么 dc 是 什么 ? 
在 大 多 数 的 Unix 系统 中 都 提供 了 联机 帮助 ,可 以 从 那里 得 到 需要 的 信息 ,要 找 关 于 dc 
的 信息 ,只 要 输入 : 


$ man dc 

User Commands dc(1) 

NAME 
dc — desk calculator 

SYNOPSIS 
dc [ filename ] 

DESCRIPTION 
dc is an arbitrary precision arithmetic package . Ordinarily 
it operates on decimal integers, but one may specify an 
input base, output base, and a number of fractional digits 
to be maintained. The overall structure of dc is a stacking 
(reverse Polish) calculator. If an argument is given, input 
is taken from that file until its end, then from the standard 


input. 


这 些 信息 来 自 于 SunOS 5. 8 的 联机 帮助 ,大 多 数 Unix 系统 关于 dc 的 描述 都 是 类 似 的 ， 
它 说 明了 dc 是 一 个 计算 器 , 它 能 够 接收 逆 波 兰 表 达 式 ,算出 表达 式 的 值 。 逆 波兰 表达 式 指 的 
是 操作 数 在 前 ,操作 符 在 后 ,也 称 做 后 缀 表达 式 , 如 要 计算 表达 式 2+ 3 的 值 , 它 所 对 应 的 逆 波 
兰 表 达 式 是 23 + ,dc 的 输入 /输出 如 下 : 


mo + WwW N 


内 部 进行 的 操作 是 这 样 的 : 先 将 2 人 栈 , 再 将 3 入 栈 , 然 后 将 栈 顶 的 两 个 数 出 栈 , 计 算 它 
们 的 和 ,并 将 结果 入 栈 ,p 是 为 了 将 栈 顶 元 素 打印 出 来 。 这 样 可 以 知道 dc 是 一 个 基于 栈 的 计 
Rak ABA be 是 什么 ? dc 的 运行 条 件 又 是 如 何 被 满足 的 呢 ? 

读 了 be 的 联机 帮助 就 会 知道 ,bc 是 dc 的 预 处 理 器 , 它 将 用 户 输入 的 表达 式 转 换 成 道 波 
兰 表 达 式 ,然后 通过 一 个 称 为 管道 (pipe) 的 通信 程序 交 给 dc, 如 图 1.12 所 示 。 





图 1.12 程序 交换 信息 O 
用 户 输 入 中 缀 表达 式 如 “2 十 2”,bc 将 它 转化 为 相应 的 后 缀 表达 式 形 式 , 交 给 dc 执行 ,dc 
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计算 表达 式 的 值 , 将 结果 返回 给 bbe, be 再 将 结果 以 合适 的 形式 显示 在 显示 器 上 。 所 以 对 普通 
用 户 而 言 ,bc 就 是 计算 器 。 

与 网 络 桥 牌 类 似 , 计 算 器 也 是 由 不 同 的 程序 互相 协作 构成 一 个 完整 系统 的 ,每 个 程序 有 
各 目的 功能 ,互相 独立 、 相 互 协作 。Unix 系统 编程 在 很 多 场合 下 ,就 是 要 解决 好 建立 这 些 独 
立 程序 之 间 的 连接 和 协作 方式 的 问题 。 


1.5.4 从 bc/dc 到 Web 


从 架构 的 角度 来 看 ,万维网 (World Wide Web) 5j bc/dc 是 十 分 类 似 的 。 通 过 刚才 的 学 
习 可 以 知道 bc 负责 用 户 界 面 ,dc 负责 后 台 运 算 ,在 万 维 网 中 ,浏览 器 负责 用 户 界 面 ,在 后 面 
负责 提供 网 页 的 是 Web 服务 器 ,如 图 1. 13 所 示 。 






http: // www.xyz.com/ info 


<htmI><head><title> … — 服务 器 





图 1.13 游览 器 和 Web 服务 器 通信 


用 户 直 接 操 作 浏览 器 ,从 浏览 器 上 看 到 网 页 的 效果 ,而 网 页 并 不 存放 在 浏览 器 上 ,而 是 
存放 在 Web 服务 器 上 ,网 页 由 HTML 语言 写成 ,就 像 dc 的 语法 一 样 ,HTML 不 是 很 容易 理 
解 , 且 不 直观 。 用 户 端 的 工具 一 一 浏览 器 就 像 bc 一 样 ,从 服务 器 上 接收 到 信息 后 ,会 把 它 以 
容易 理解 的 形式 直观 地 显示 给 用 户 。 

所 以 说 万 维 网 与 bc/dc 是 类 似 的 ,而 Web 首先 出 现在 Unix 平台 上 也 是 一 件 自 然而 然 的 
事情 。 


1.6 动手 实践 


前 面 的 部 分 通过 两 个 问题 进行 学 习 , 它 们 是 “ 它 能 做 什么 ?” 和 “ 它 是 如 何 实 现 的 ?” 接 下 
来 应 该 是 第 三 个 问题 了 :“ 能 不 能 自己 编写 一 个 ?”。 在 本 节 试 着 自己 编写 一 个 程序 来 实现 
more 的 功能 。 

首先 ,more 能 做 什么 ? 

more 可 以 分 页 显示 文件 的 内 容 , 大 部 分 的 Unix 系统 都 有 文本 文件 /etc/termcap, 它 经 
常 被 文本 编辑 器 和 游戏 程序 用 到 ,用 more 来 查看 它 的 内 容 : 


$ more /etc/termcap 
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more 会 显示 文件 第 一 屏 的 内 容 , 在 屏幕 的 底部 ,more 用 反 白字 体 显 示 文 件 的 百分比 ,这 
时 如 果 按 空格 键 ,文件 的 下 一 屏 内 容 会 显示 出 来 ,如 果 按 回 车 键 ,显示 的 则 是 下 一 行 ,如 果 输 
人“q”, 结 束 显 示 , 如 果 输 入 “h”, 显 示 出 来 的 是 more 的 联机 帮助 。 

注意 , 当 按 空格 键 或 输入 “q” 后 ,程序 会 立即 响应 ,而 无 需 再 按 回 车 键 。 

more 有 3 种 用 法 : 


S more filename 
$ command | more 


S more < filename 


第 一 种 情况 ,more 显示 文件 filename MAR; 第 二 种 情况 more 将 command 命令 的 输 
出 分 页 显示 ; 第 三 种 情况 ,more 从 标准 输入 获取 要 分 页 显示 的 内 容 , 而 这 时 more 的 标准 输 
入 被 重 定向 到 文件 filename。 

第 二 个 问题 ,more 是 如 何 实现 的 ? 

通过 运行 more 并 观察 结果 可 以 知道 ,more 的 工作 流程 如 下 : 


*-—--—-—7» show 24 lines from input 
| +--> print [more?] message 
| | Input Enter, SPACE, or q 
| *-- if Enter, advance one line 
*t--—- if SPACE 
if q —-— exit 


接 下 来 要 编写 的 程序 应 该 像 实际 的 more 一 样 , 有 足够 的 灵活 性 ,也 就 是 说 ,如 果 在 命令 
行 中 给 出 了 文件 名 ,那么 就 分 页 显示 这 个 文件 ,否则 的 话 , 从 标准 输入 得 到 要 分 页 显示 的 内 
容 。 下 面 是 more 的 第 一 个 版 本 


/x more01.c — version 0.1 of more 
* read and print 24 lines then pause for a few special commands 
x/ 
# include <stdio. h> 
+ define PAGELEN 24 
it define LINELEN 512 
void do more(FILE x ); 
int see more(); 
int main( int ac, char x av[]) 
1 
FILE * fp; 
if (ac == 1) 
do more(stdin); 
else 
while ( —— ac) 
if ( (fp = fopen( x ++av, "r" )) = NULL) 
| 
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do more( fp ); 
fclose( fp); 
j 
else 
exit(1); 
return Q; 
j 
void do more( FILE x fp) 
/* 








x read PAGELEN lines, then call see more() for further instructions 


*/ 
{ 
char line! LINELEN |; 
int num_of_lines = 0; 
int see_more(), reply; 
while ( fgets( line, LINELEN, fp ) ){ 
if ( num of lines == PAGELEN ) | 
reply = sée more(); 


if ( reply == 0) 


break; 
num of lines ~= reply; 
} 
if ( fputs( line, stdout ) == EOF ) 
exit(1); 


num of lines tt; 


} 


int see more() 


/* 


/* more input */ 
/* full screen? x/ 
/x y, ask user */ 


/* n: done x / 
/x reset count x/ 
/* show line x/ 


/* or die */ 


/x count it «/ 


* print message, wait for response, return # of lines to advance 


* q means no, space means yes, CR means one line 


x/ 
{ 
int c; 
printf("\033[7m more? N033[m ); 
while( (c = getchar()) 1= EOF ) 
( 
if (c == 'q') 
return 0; 
if (c == 11) 
return PAGELEN; 
if (c == '\n'! ) 


return 1; 


/* reverse on a vt100 «/ 


/x get response x/ 


/x q -> Nx/ 


/* * * => next page x/ 


/x how many to show x/ 


/x Enter key => 1 line */ 
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return 0; 


} 


ERISA 3 个 函数 ,在 主 函 数 中 判断 应 该 从 文件 还 是 标准 输入 中 获取 数据 ,并 打开 相 
应 的 数据 源 ,然后 调用 do. more 函数 ,do_more 将 数据 显示 在 显示 器 上 , 满 一 屏 后 ,调用 see_ 
more 图 数 接收 用 户 的 输入 ,以 决定 下 一 步 的 动作 。 编 译 并 运行 上 述 代码 : 


S cc moreO01.c - o more01 


$ more01 more0l.c 


这 个 程序 可 以 完成 基本 的 功能 ,显示 了 24 行 后 就 停 下 来 等 待 输入 ,而 且 在 屏幕 下 方 会 有 
反 白 的 提示 |more?] , 当 按 回 车 键 后 会 显示 下 一 行 。 


但 是 问题 也 是 存在 的 , 当 屏幕 上 的 文字 上 滚 时 ,|more?| 也 会 随 之 上 滚 , 这 并 不 是 所 需要 
的 ,而 且 当 按 空格 键 或 输入 “gq” 后 ,如 果 不 按 回 车 键 , 那 程序 什么 也 不 会 做 。 

这 个 程序 还 需要 改进 ,但 是 通过 这 个 简单 的 例子 ,可 以 知道 以 下 事实 : Unix 编程 不 是 很 
难 ,但 也 不 是 轻而易举 的 事情 。 

这 个 程序 的 目标 很 清晰 ,实现 算法 也 不 复杂 ,但 是 除了 算法 ,还 有 其 他 问题 需要 考虑 。 

接 下 来 有 这 样 一 些 问题 如 何 使 得 不 用 回 车 ,程序 就 得 到 输入 ? 如 何 计 算 显 示 的 百 分 
Eb? 如 何 去 掉 反 白 的 |more?|? 

先 来 看 对 数据 源 的 处 理 ,在 main 函数 中 检查 命令 参数 的 个 数 ,如 果 没 有 参数 , 那 就 从 标 
准 输入 读 取 数 据 , 这 样 一 来 more 就 可 以 通过 管道 重 定向 来 得 到 数据 ,如 : 


$ who | more 


who 命令 列 出 当前 系统 中 活动 的 用 户 ,管道 命令 “| who 的 输出 重 定向 到 more 的 输 
入 , 结 采 是 每 次 显示 24 个 用 户 后 暂停 ,在 有 很 多 用 户 的 情况 下 ,用 more 来 对 who 的 输出 进 
行 分 页 就 会 很 有 必要 。 

接 下 来 是 输入 重 定向 的 问题 ,看 以 下 例子 : 


$ ls /bin | more01 


期 望 的 结果 是 将 /bin 目录 下 的 文件 分 页 ,显示 24 行 以 后 暂停 。 

然而 实际 的 运行 结果 并 不 是 这 样 的 ,24 行 以 后 并 没有 暂停 而 是 继续 输出 ,问题 在 娜 
里 呢 ? 

当 more01 AH 24 后 , 它 打 印 了 [more?|, 然 后 等 待 用户 的 输入 。 

用 户 的 输入 是 从 哪里 来 的 ? 在 more01 中 用 getchar(), 它 是 从 标准 输入 读数 据 的 ,问题 
就 在 这 里 。 刚 才 的 命令 ， 


$ ls /bin | more01 


已 经 将 more01 的 标准 输入 重 定向 到 ls 的 标准 输出 ,这 样 more01 将 从 同一 个 数据 流 中 读 用 





«20 * Unix/Linux 编程 实践 教程 





户 的 输入 ,这 显然 有 问题 ,图 1. 14 描述 了 这 种 状况 。 





图 1. 14 more 从 标准 输入 读数 据 
解决 这 个 问题 的 方法 是 ,从 标准 输入 中 读 人 要 分 页 的 数据 ,直接 从 键盘 读 用 户 的 输入 ， 
如 图 1.15 所 示 。 





1.15 more 从 键盘 读 用 户 的 输入 


图 1. 15 中 有 一 个 文件 /dev/tty, 这 是 键盘 和 显示 器 的 设备 描述 文件 ,向 这 个 文件 写 相 当 
于 显示 在 用 户 的 屏幕 上 , 读 相 当 于 从 键盘 获取 用 户 的 输入 。 即 使 程序 的 输入 /输出 被 二 ”或 


“二 ” 重 定 癌 ,程序 还 是 可 以 通过 这 个 文件 与 终端 交换 数据 ，。 
从 图 1. 15 中 可 以 知道 ,more 有 两 个 输入 ,程序 的 标准 输入 是 ls 的 输出 ,将 其 分 页 显示 


到 屏幕 上 , 当 more 需要 用 户 输入 时 , 它 可 以 从 /dev/tty 得 到 数据 。 
运用 上 述 知 识 改 进 more01. c, 18 8| more02. c: 


/* more02.c — version 0.2 of more 
* read and print 24 lines then pause for a few special commands 


* feature of version 0.2: reads from /dev/tty for commands 


x/ 
# include <stdio. h> 
+ define PAGELEN 24 
+ define LINELEN 512 
void do more(FILE x); 
int see more(FILE x); 
int main( int ac, char xav[]) 
{ 
FILE * fp; 
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if (ac == 1) 

do more( stdin ); 
else 

while ( -- ac ) 


if ( (fp = fopen( * + +av, "r" )) !- NULL) 


( 
do more( fp); 
fclose( fp); 
} 
else 
exit(1); 
return 0; 
} 
void do more( FILE x fp) 
/* 


* read PAGELEN lines, then call see more() for further instructions 


x/ 
( 
char line| LINELEN] ; 
int num of lines = 0; 
int see more(FILE *), reply; 
FILE x fp tty; 
fp tty = fopen( "/dev/tty", "r" ); 
if ( fp tty == NULL ) 
exit(1); 
while ( fgets( line, LINELEN, fp ) ) { 
if ( num of lines == PAGELEN ) | 
reply = see more(fp tty); 
if ( reply == 0) 


break; 
num of lines ~= reply; 
} 
if ( fputs( line, stdout ) == EOF ) 
exit(1); 


num of lines t*; 


} 


int see more(FILE * cmd) 


/* 


/* NEW: cmd stream x/ 
/* if open fails */ 

/* no use in running */ 
/* more input x/ 

/* full screen? x/ 

/x NEW. pass FILE x x/ 


/* n; done x/ 
/* reset count */ 
/* show line x/ 


/x or die x/ 


/* count it x/ 


/* NEW; accepts arg */ 


* print message, wait for response, return # of lines to advance 


* q means no, space means yes, CR means one line 


x/ 


int C; 


。 2] 
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printf("X033[7m more? \033[Lm") ; /x reverse on a vt100 x/ 
while( (c=getc(cmd)) ! = EOF ) /* NEW; reads from tty x / 
( 
if(c == 'q') /*q—Nx/ 
return 0; 
if (c == '') /x ' ' => next page x/ 
return PAGELEN ; /* how many to show x/ 
if (c == '\n' ) /* Enter key => 1 line */ 
return 1; 
j 
return 0; 
} 
编译 并 测试 新 的 程序 : 


$ cc - o more02 more02.c 
$ ls /bin | more02 


more02.c 可 以 从 标准 输入 得 到 数据 ,也 可 以 从 键盘 得 到 用 户 的 输入 ,同时 通过 编写 
more02. c, 增 加 了 对 文件 /dev/tty 的 了 解 。 | 

more02. c 还 需要 进一步 完善 , 当 用 户 按 空格 键 或 输入 “q” 后 ,还 得 按 回 车 键 ,程序 才 会 动 
作 , 而 且 输 入 的 字符 会 显示 出 来 。 实 际 的 more 是 不 需要 额外 的 回 车 的 ,而 且 输 入 的 字符 也 
^g. 

3. 对 输入 的 进一步 处 理 

用 户 操作 的 终端 有 很 多 参数 ,可 以 调整 参数 使 得 用 户 输入 的 字符 被 立即 送 到 程序 ,而 不 
用 等 待 回 车 ,还 可 以 使 输入 的 字符 不 回 显 , 如 图 1. 16 所 示 。 





图 1.16 终端 参数 是 可 调 的 


图 1. 16 中 新 加 入 部 分 是 用 于 调整 终端 参数 的 ,程序 运行 的 时 候 可 以 动态 地 调整 终端 的 
参数 。 
要 编写 一 个 完善 的 more 还 有 很 多 工作 要 做 ,以 下 是 留 给 读者 的 问题 。 如 何 知道 文件 中 
已 显示 的 百分比 ? 要 知道 百分比 就 必须 知道 文件 的 大 小 ,这 些 信息 操作 系统 是 提供 的 ,需要 
用 合适 的 系统 调用 来 得 到 。 如 何 反 白 显示 文字 ? 如 何 确定 每 一 页 的 行 数 ? 这 些 都 跟 终端 类 
型 有 关 , 如 果 将 每 一 页 定 为 24 行 、 终 端 类 型 定 为 vt100, 那 么 程序 就 缺乏 足够 的 灵活 性 。 如 
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何 使 程序 能 够 处 理 各 种 类 型 的 终端 ? 那 就 需要 学 习 如 何 控制 和 调整 终端 参数 的 知识 。 


1.7 工作 步骤 与 概要 图 


1.7.1 接 下 来 的 工作 步骤 


Unix 系统 是 一 个 多 用 户 系统 , 它 允 许 很 多 用 户 很 多 程序 同时 工作 ,程序 经 常 对 文件 、 目 
录 进 行 操作 ,对 数据 进行 转换 或 传输 。 同 一 台 机 器 上 的 不 同 程序 之 间 , 甚 至 不 同 机 器 上 程序 
之 间 通 过 网 络 都 可 以 互相 通信 。 

这 么 多 复杂 的 程序 ,它们 的 功能 是 什么 ? 是 如 何 工作 的 ?在 中 间 操 作 系 统 做 了 些 什么 ? 
随 着 学 习 的 深入 ,这 些 问 题 会 越 来 越 多 地 被 解答 。 

在 研究 more 的 过 程 中 展示 了 解决 问题 的 步骤 ,首先 分 析 一 个 实际 存在 的 程序 , 弄 清 它 
的 功能 ,分 析 它 的 实现 原理 ,然后 自己 编写 一 个 。 通 过 对 程序 的 不 断 完善 来 更 多 地 了 和解 Unix 
系统 和 它 的 工作 原理 。 这 也 是 本 书 采用 的 主要 方法 。 


1.7.2 Unix 的 概要 图 


Unix 的 结构 如 图 1.17 所 示 。 





图 1.17 Unix 系统 的 主要 结构 


图 1.17 描述 了 Unix 系统 的 主要 结构 ,内 存 被 分 为 系统 空间 和 用 户 空间 ,内 核 和 它 的 数 
据 结构 位 于 系统 空间 ,用 户 程序 位 于 用 户 空间 ,用 户 通过 终端 连接 到 系统 ,文件 存放 在 磁盘 
上 ,各 种 各 样 的 设备 被 内 核 直接 管理 ,用 户 程序 可 以 通过 内 核 来 访问 设备 ,最 后 还 有 网 络 连 
接 , 用 户 可 以 通过 网 络 接 人 系统 。 

接 下 来 的 每 章 都 会 关注 系统 的 某 一 个 部 分 ,介绍 相关 的 系统 调用 逻辑 和 数据 结构 。 学 
完 本 书后 ,会 对 图 1. 17 中 每 一 个 部 分 都 有 所 了 解 ,应 该 能 够 编写 一 般 的 _Unix 系统 程序 ,如 
网 络 桥牌 。 


1.7.3 Unix 的 发 展 历 程 


这 本 书 的 主要 内 容 是 介绍 Unix 的 系统 结构 和 相关 概念 ,以 及 如 何 编写 Unix 程序 ,你 可 
能 会 问 ,Unix 从 哪里 来 ? 它 是 怎么 发 展 的 ? 在 这 里 简要 地 介绍 Unix 的 发 展 历程 。 

1969 年 ,贝尔 实验 室 的 计算 机 科学 家 发 明了 Unix, 最 初 的 Unix 是 由 内 核 和 一 些 工 具 组 
成 的 , 它 并 不 是 一 个 商业 产品 ,实际 上 在 20 世纪 70 年 代 , 贝 尔 实验 室 向 大 学 和 研究 机 构 提供 
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Unix, 包 括 完 整 的 源 代码 , 仅 收 取 象 征 性 的 费用 。 贝 尔 实验 室 以 及 其 他 的 计算 机 科学 家 不 断 
地 改进 Unix. f 1980 年 ,一 些 公司 发 布 了 商用 的 Unix, 这 时 的 Unix 主要 分 为 两 个 系列 ,一 
个 是 AT&T Za System V, 另 一 个 是 加 利 福 尼 亚 大 学 伯克利 分 校 的 BSD, 大 多 数 的 Unix 
都 源 自 上 述 两 个 Unix 版 本 。 几 年 后 ,伯克利 停止 了 BSD 的 研究 ,System V 则 被 销售 给 了 其 
他 公司 。 

Unix 在 商业 计算 和 研究 机 构 得 到 很 大 的 发 展 , 出 现 了 不 同 的 方向 ,如 有 些 Unix 的 实时 
性 就 很 出 众 。 虽 然 各 种 Unix 不 尽 相 同 ,但 Unix 的 核心 架构 和 其 主要 系统 调用 却 可 以 保持 
稳定 ,1980 年 AT&T W Unix 与 1991 年 在 赫尔辛基 诞生 的 Unix 会 有 很 大 不 同 ,但 1980 年 
编写 的 Unix 程序 稍 加 修改 就 可 以 在 1991 年 的 Unix 上 运行 。 

那么 什么 是 Unix 呢 ? 只 要 有 与 这 些 版 本 类 似 的 结构 和 运行 特性 ,提供 应 有 的 系统 服 
FF , 那 就 是 Unix。 由 于 不 同 机 构 对 Unix 的 不 断 发 展 ,现在 有 些 系统 看 起 来 很 像 Unix, 但 在 
代码 里 却 看 不 到 System V 或 USB 的 影子 ,如 GNU/Linux, POSIX 标准 中 用 形式 化 的 方法 
描述 了 Unix 的 系统 接口 ,但 是 要 了 解 Unix, 单 单一 个 标准 是 不 够 的 。 

Unix 有 很 长 的 发 展 历史 和 不 同 的 版 本 ,所 以 ,一 本 书 所 能 涵盖 的 是 十 分 有 限 的 。 本 书 只 
TB SAA Unix 共有 的 原理 .技术 和 结构 ,各 个 不 同 版 本 的 Unix 的 特点 并 不 在 本 书 介绍 
的 范畴 内 。 

你 可 能 工作 在 SunOS 上 ,也 可 能 在 AIX 或 其 他 的 Unix 平台 上 ,关于 特定 平台 的 知识 可 
以 参考 所 使 用 平台 的 联机 帮助 ,实际 上 对 本 书 的 学 习 很 大 程度 上 要 借助 联机 帮助 。 

要 是 注意 的 话 就 会 发 现 , 有 了 时候 一 项 功能 可 以 用 不 同 的 函数 来 实现 ,这 有 两 个 原因 。 一 
是 Unix 是 由 不 同 的 机 构 完 善 的 ,如 AT&T 和 BSD, 对 于 同一 个 要 解决 的 问题 ,他 们 采用 了 
不 同 的 溺 数 名 来 实现 。 另 一 个 原因 是 Unix 自身 的 发 展 需要 兼容 , 当 有 一 个 新 的 服务 可 以 替 
代 老 的 服务 时 ,人 们 并 不 会 把 老 的 系统 调用 去 掉 , 而 是 增加 新 的 系统 调用 ,这 就 使 以 前 编写 
的 程序 也 可 以 顺利 地 运行 。 在 本 书 中 也 有 这 样 的 情况 ,可 以 用 不 同 的 函数 来 做 同一 件 事情 ， 
作为 系统 程序 员 ,这 是 经 常 的 和 不 可 避免 的 。 


小 8 


”计算 机 系统 中 包含 了 很 多 系统 资源 ,如 硬盘 内存. 外 围 设备 网 络 连接 等 ,程序 利用 
这 些 资 源 来 对 数据 进行 存储 、 转 换 和 处 理 。 

”多 用 户 系 统 和 需要 一 个 中 央 管 理 程序 ,Unix 的 内 核 就 是 这 样 的 程序 , 它 可 以 对 程序 和 和 
资源 进行 管理 。 

。 用 户 程序 要 访问 设备 必须 经 过 内 核 。 

”一 些 Unix 的 系统 功能 是 由 多 个 程序 的 协作 而 实现 的 。 

要 编写 系统 程序 ,必须 对 系统 调用 和 相关 的 数据 结构 有 深入 的 理解 。 


第 2 章 有 用户、 文件 操作 与 联机 帮助 : 
编写 who 命令 





概念 与 技巧 

。 联机 帮助 的 作用 与 使 用 方法 

。 Unix 的 文件 操作 图 数 : open、read、write,lseek、close 
。 文件 的 建立 与 读 写 

。 文件 描述 符 

。 缓冲 : 用 户 级 的 缓冲 与 内 核 级 的 缓冲 

。 内 核 模 式 .用 户 模式 和 系统 调用 的 代价 

。 Unix 表示 时 间 的 方法 与 时 间 格 式 间 的 转换 
。 借助 utmp 文件 来 列 出 已 登录 的 用 户 

。 系统 调用 中 的 错误 检测 与 处 理 
相关 的 系统 调用 

e Open read、 write,creat,lseek,close 

* perror 

相关 命令 

* who 

。 cp 

* login 


2.1 54r 2H 


在 使 用 Unix 的 时 候 , 经 常 需 要 知道 有 哪些 用 户 正在 使 用 系统 ,系统 是 否 很 繁忙 , 某 人 是 
否 正 在 使 用 系统 等 。 为 了 回答 这 些 问 题 ,可 以 使 用 who 命令 ,所 有 的 多 用 户 系统 都 会 有 这 个 
命令 。 这 个 命令 会 显示 系统 中 活动 用 户 的 情况 。 接 下 来 的 问题 是 , who 命令 是 如 何 工作 
的 呢 ? 
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本 章 分 析 Unix 中 的 who 命令 ,通过 分 析 来 学 习 Unix 的 文件 操作 。 除 此 之 外 ,还 将 学 习 
如 何 从 Unix 的 联机 帮助 中 得 到 有 用 的 信息 。 


2.2 关于 命令 who 


下 面 给 出 了 Unix 系统 的 概览 图 ,如 图 2.1 Bron. 





图 2, 1 用户、 文件. 进程 .设备 和 内 核 


图 2. 1 中 最 大 的 长 方 体 代表 计算 机 内 存 , 它 被 分 为 用 户 空间 和 系统 空间 ,用 户 通过 终端 
连接 到 系统 ,一 大 一 小 两 个 柱状 体 代 表 两 个 硬盘 ,系统 中 还 有 一 个 打印 机 。 靠 上 方 的 3 个 较 
小 的 长 方 体 代表 3 个 应 用 程序 ,它们 运行 在 用 户 空间 ,通过 内 核 与 外 界 进 行 通 信 ,应 用 程序 和 
内 核 之 间 的 连 线 代 表 通 信 管 道 。 

本 章 的 第 一 个 程序 通过 对 以 下 3 个 问题 的 解答 来 学 习 who (8^ 

1. who 命令 能 做 些 什 么 ? 

2. who 命令 是 如 何 工 作 的 ? 

3. 如 何 编写 who? 

5 令 也 是 程序 

在 开始 之 前 ,需要 声明 的 是 ,在 Unix 系统 中 ,几乎 所 有 的 命令 都 是 人 为 编写 的 程序 ,如 
who 和 1s ,而 且 它 们 中 的 大 多 数 都 是 用 C 语言 写 的 。 当 在 命令 行 中 输入 ls,Shell( 命 令 解 释 
ar) NL ALIA PARIS IT AHH ls 的 程序 。 如 果 对 ls 所 提供 的 功能 还 不 满意 ,完全 可 以 编写 和 使 
用 上 自己 的 1s 命令。 

在 Unix 系统 中 增加 新 的 命令 是 一 件 很 容易 的 事 。 把 程序 的 可 执行 文件 放 到 以 下 任意 
一 个 目录 就 可 以 了 : /bin /usr/bin /usr/local/bin, 这 些 目 录 里 面 存 放 着 很 多 系统 命令 。 
Unix 系统 中 一 开始 并 没有 这 么 多 的 命令 ,一 些 人 编写 程序 用 来 解决 某 个 特定 的 问题 ,而 其 他 
人 也 觉得 这 个 程序 很 有 用 , 随 着 越 来 越 多 的 使 用 ,这 个 程序 就 逐渐 成 了 Unix 的 标准 命令 。 
说 不 定 哪 一 天 ,你 编写 的 程序 也 会 成 为 标准 命令 。 
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2.3 问题 1: who 命令 能 做 些 什么 


如 果 想 要 知道 都 有 谁 正在 使 用 使 用 系统 ,只 有 输入 who 命令 ,输出 如 下 : 


$ who 

heckerl  ttypl Jul 21 19:51 (tide75. surfcity. com) 

nlopez  ttyp2 Jul 21 18;11 (roam163 ~ 141. student. ivy. edu) 
dgsulliv ttyp3 Jul 21 14:18 (h004005a8bd64. ne. mediaone. net) 
ackerman ttyp4 Jul 15 22:40 (asdl -~ 254. fas. state. edu) 
wwchen ttyp5 Jul 21 19:57 (circle. square. edu) 

barbier ttyp6 Jul 8 13:08 (labpcl8.elsie. special. edu) 
ramakris ttyp7 Jul 13 08:51 (roam157 — 97. student. ivy. edu) 
czhu ttyp8 Jul 21 12:47 (spa. sailboat. edu) 

bpsteven ttyp9 Jul 21 18:26 (207.178.203.99) 

molay ttypa Jul 21 20:00 (xyz73 - 200. harvard. edu) 


$ 


每 一 行 代表 一 个 已 经 登录 的 用 户 , 第 1 列 是 用 户 名 ,第 2 列 是 终端 名 ,第 3 列 是 登录 时 
间 ,第 4 列 是 用 户 的 登录 地 址 , 某 些 版 本 的 who 命令 在 默认 状态 下 不 给 出 第 4 列 的 内 容 。 


阅读 手册 
通过 直接 运行 命令 ,可 以 了 解 who 的 大 致 功能 ,要 进一步 了 解 who 的 用 法 ,需要 借助 联 
机 帮助 。 


每 一 个 Unix 在 发 售 的 时 候 都 会 带 上 大 量 的 有 关 各 个 命令 使 用 方法 的 文档 。 以 前 ,这 些 
文档 是 打印 出 来 的 ,现在 有 电子 版 的 可 供 使 用 。 查 看 联机 帮助 的 命令 是 man, 如 要 查看 who 
的 帮助 ,可 输入 : 


$ man who 
who(1) 
NAME 
who — Identifies users currently logged in 
SYNOPSIS 
who [ -a] |[ - AbdhH1mMpqrstTu] [file] 
who am i 
who am I 
whoami 


The who command displays information about users and processes on the local system. 
STANDARDS 


Interfaces documented on this reference page conform to industry standards as follows: 


who; XPG4 , XPG4 ~ UNIX 
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Refer to the standards(5) reference page for more information about industry standards and 


associated tags. 
OPTIONS 


-a Specifies all options; processes /var/adm/utmp or the named file with all options on. 
Equivalent to using the - b, -d, -1, -p, -r, -t, - T, and -u options. 
more(10 $ ) 


所 有 命令 的 联机 帮助 都 有 相同 的 基本 格式 ,从 第 1 行 可 以 知道 这 是 关于 哪个 命令 的 帮 
助 ,还 可 以 知道 这 个 帮助 是 位 于 哪 一 节 的 。 在 这 个 例子 中 ,从 第 1 行 的 内 容 who(1), 可 以 知 
道 这 是 who 命令 的 帮助 , 它 的 小 节 编 号 是 1. Unix 的 联机 帮助 分 为 很 多 节 , 如 第 1 小 节 中 是 
关于 用 户 命令 的 帮助 ,第 2 小 节 中 是 关于 系统 调用 的 帮助 ,第 5 小 节 中 是 关于 配置 文件 的 帮 
助 。 你 可 查看 一 下 Unix 系统 的 联机 帮助 ,了 解 其 他 节 讲 述 的 内 容 。 

名 字 (NAME) 部 分 包含 命令 的 名 字 以 及 对 这 个 命令 的 简短 说 明 。 

概要 (SYNOPSYS) 部 分 给 出 了 命令 的 用 法 说 明 , 包 括 命令 格式 、 参 数 和 选项 列表 。 选 项 
指 的 是 一 个 短线 后 面 紧 跟 着 一 个 或 多 个 英文 字母 ,如 -a、 -Bec, 命 令 的 选项 影响 该 命令 所 进 
行 的 操作 。 

在 联机 帮助 中 , 方 括号 (f -a]) 表 示 该 选项 不 是 一 个 必须 的 部 分 。 帮 助 中 指出 who 的 写 
法 可 以 是 who, RA who -a, 或 者 who -加 上 AbdhHlmMparstTu 这 些 字 母 的 任意 组 合 ,在 
命令 的 末尾 还 可 以 有 一 个 文件 参数 。 

从 帮助 中 可 以 知道 who 命令 还 有 其 他 3 种 形式 : 


who am 1 
who am I 


whoami 


从 联机 帮助 中 还 可 以 获得 上 述 形式 的 进一步 帮助 。 

描述 (DESCRIPTION) 部 分 是 关于 命令 功能 的 详细 阐述 ,根据 命令 和 平台 的 不 同 ,描述 
的 内 容 也 不 同 , 有 的 简洁 、 精 确 , 有 的 包含 了 大 量 的 例子 。 不 管 怎么 样 , 它 描述 了 命令 的 所 有 
功能 ,而 且 是 这 个 命令 的 权威 性 解释 。 

选项 (OPTIONS) 部 分 给 出 了 命令 行 中 每 一 个 选项 的 说 明 。 早 期 的 Unix 命令 的 功能 都 
很 简单 ,每 个 命令 只 有 一 两 个 选项 ,但 随 着 时 间 的 推移 ,命令 的 功能 越 来 越 多 ， 基本 上 每 个 选 
项 用 来 实现 一 个 功能 ,所 以 选项 也 越 来 越 多 , 像 who 命令 就 有 很 多 选项 。 

参阅 (SEE ALSO) 部 分 包含 与 这 个 命令 相关 的 其 他 主题 。 有 些 帮 助 还 有 BUG 部 分 。 


2.4 问题 2: who 命令 是 如 何 工作 的 


前 面 看 到 who 命令 可 以 显示 出 当前 系统 中 已 名 条 登录 的 用 户 信息 ,联机 帮助 中 描述 了 
who 的 功能 和 用 法 ,现在 的 问题 是 : who 是 如 何 来 实现 这 些 功 能 的 ? 
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你 可 能 会 认为 , 像 who 这 样 的 系统 程序 一 定 会 用 到 一 些 特殊 的 系统 调用 ,需要 高 级 管理 
员 的 权限 ,要 编号 这 样 的 程序 得 要 花 很 多 钱 来 购买 系统 开发 工具 ,包括 光盘 .参考 书 等 。 

实际 上 ,所 需 的 资料 都 在 系统 中 ,你 要 知道 的 仅仅 是 如 何 找到 这 些 资料 。 

1l. 从 Unix 中 学 习 Unix 

以 下 4 项 技巧 会 有 助 于 你 的 学 习 : 


。 人 阅读 联机 帮助 

。 搜索 联机 帮助 

。 阅读 . h 文件 

。 从 参阅 部 分 (SEE ALSO) 得 到 启示 
2. 阅读 联机 帮助 


以 who 为 例 ,在 命令 行 输入 如 下 命令 : 


$ man who 


翻 到 描述 部 分 ,如 果 是 在 SunOS 平台 上 ,可 以 看 到 如 下 内 容 ， 


DESCRIPTION 
The who utility can list the user^s name, terminal line, login time, elapsed time since 
activity occurred on the line, and the process - ID of the command interpreter (shell) for 
each current UNIX system user. It examines the /var/adm/utmp file to obtain its information. 
If file is given, that file (which must be in utmp(4) format) is examined. Usually, file will 


be /var/adm/wtmp, which contains a history of all the logins since the file was last created. 


上 述 描 述说 明 , 已 登录 用 户 的 信息 是 放 在 文件 /var/adm/utmp 中 的 ,who 通过 读 该 文件 
获得 信息 。 可 以 通过 搜索 联机 帮助 来 了 解 这 个 文件 的 结构 信息 。 

3. 搜索 联机 帮助 

使 用 带 有 选项 一 k 的 man 命令 可 以 根据 关键 字 搜索 联机 帮助 。 如 果 要 查找 “utmp” 的 信 
上 ,在 命令 行 输入 如 下 命令 : 


$ man - k utmp 





endutent getutent (3c) — access utmp file entry 
endutxent getutxent (3c) ~ access utmpx file entry 
getutent getutent (3c) — access utmp file entry 
getutid getutent (3c) - access utmp file entry 
getutline getutent (3c) - access utmp file entry 
getutmp getutxent (3c)  — access utmpx file entry 
getutmpx getutxent (3c)  — access utmpx file entry 
getutxent getutxent (3c)  - access utmpx file entry 
getutxid getutxent (3c) ~ access utmpx file entry 
getutxline getutxent (3c)  - access utmpx file entry 
pututline getutent (3c) - access utmp file entry 
pututxline | getutxent (3c) ~ access utmpx file entry 
setutent getutent (3c) ~ access utmp file entry 
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setutxent getutxent (3c) access utmpx file entry 
ttyslot ttyslot (3c) find the slot in the utmp file of the current user 
updwtmp getutxent (3c) access utmpx file entry 
updwtmpx getutxent (3c) access utmpx file entry 
utmp utmp (4) utmp and wtmp entry formats 
utmp2wtmp acct (1m) overview of accounting and miscellaneous accounting 
commands 
utmpd utmpd (1m) utmp and utmpx monitoring daemon 
utmpname getutent (3c) access utmp file entry 
utmpx utmpx (4) utmpx and wtmpx entry formats 
utmpxname getutxent (3c) access utmpx file entry 
wtmp utmp (4) utmp and wtmp entry formats 
wtmpx utmpx (4) utmpx and wtmpx entry formats 
$ 


以 上 的 输出 是 在 SunOS 平台 上 的 输出 ,不同 版 本 的 Unix 输出 可 能 会 有 所 不 同 , 其 中 每 
一 行 都 包含 帮助 的 主题 .标题 和 一 段 简短 的 描述 。 注 意 这 一 行 ， 


utmp  utmp (4) - utmp and wtmp entry formats 


看 起 来 好 像 就 是 所 需要 的 。 这 一 行 里 的 “4" 是 小 节 编号 ,说 明 该 帮助 是 位 于 第 4 节 , 在 查 
看 该 帮助 内 容 的 时 候 ,注意 别 把 小 节 编号 漏 了 ， 


S man 4 utmp 
utmp(4) 
NAME 
utmp, wtmp — Login records 
SYNOPSIS 
# include «utmp. h> 
DESCRIPTION 
The utmp file records information about who is currently using the system. 


The file is a sequence of utmp entries, as defined in struct utmp in the utmp. h file. 


The utmp structure gives the name of the special file associated with the users terminal, the 
users login name, and the time of the login in the form of time(3), The ut type field is the type 
of entry, which can specify several symbolic constant values. The symbolic constants are 


defined in the utmp.h file. 


The wtmp file records all logins and logouts. A null user name indicated a logout on the 
associated terminal. A terminal referenced with a tilde (~) indicates that the system was 
rebooted at the indicated time. The adjacent pair of entries with terminal names referenced bya 
vertical bar (|) or a right brace (]) indicate the system — maintained time just before and just 
after a date command has changed the systems time frame. 

The wtmp file is maintained by login(1) and init(8). Neither of these programs creates the 


file, so, if it is removed, record keeping is turned off, See ac(8) for information on the file. 





第 2 章 ” 用户、 文件 操作 与 联机 帮助 : 编写 who 命令 © 31° 


FILES 
/usr/include/utmp. h 
/var/adm/utmp 

more(88 $ ) 


到 此 已 经 离 目标 不 远 了 ，who 的 联机 帮助 说 明 who Bix utmp 这 个 文件 ,进一步 ,从 以 
上 的 说 明 可 以 知道 utmp 这 个 文件 里 面 保存 的 是 结构 数组 ,数组 元 素 是 utmp 类 型 的 结构 ,可 
以 在 utmp. h 中 找到 utmp 类 型 的 定义 , 接 下 来 的 问题 是 : utmp. h 这 个 文件 在 哪里 ? 

阅读 以 上 帮助 ,可 以 在 FILES 部 分 找到 utmp. h 这 个 文件 的 位 置 ,在 /usr/include H 
RH, 

在 进行 下 一 步 (分 析 .h 文件 ) 之 前 ,还 有 些 东西 要 引起 注意 ,上 述 帮助 提 到 wtmp 这 个 文 
件 记 录 了 关于 登录 和 注销 的 信息 , 它 涉及 到 以 下 几 个 命令 : login(1) ,init(8) 和 ac(8) ,这 些 命 
令 将 在 以 后 的 章节 讲 到 。 

通过 联机 帮助 来 学 习 Unix 就 像 在 网 络 上 寻找 信息 一 样 ,经常 能 从 某 一 个 帮助 主题 中 找 
到 相关 信息 ,链接 到 其 他 有 用 或 有 趣 的 主题 。 言 归 正 传 , 接 下 来 分 析 二 utmp. h 之 这 个 文件 。 

4. 阅读 .hh 文件 

从 utmp 的 联机 帮助 中 可 以 知道 ,utmp 中 的 数据 结构 定义 在 /usr/include/utmp. h 中 。 
在 Unix 系统 中 ,大 多 数 的 头 文件 都 存放 在 /usr/include 这 个 目录 里 , 当 C 语言 编译 器 在 源 程 
序 中 发 现 如 下 的 定义 : 


i include < stdio. h> 


它 会 到 /usrinclude 中 寻找 相应 的 头 文件 。 接 下 来 用 more 命令 来 查看 这 个 文件 的 内 容 : 


$ more /usr/include/utmp.h 


# define UTMP FILE "/var/adm/utmp" 

+ define WIMP FILE "/var/adm/wtmp" 

# include <sys/types. h> /* for pid t, time t x/ 
/* 


* Structure of utmp and wtmp files. 

* 

* Assuming these numbers is unwise. 

*/ 

# define ut_name ut_user /* compatibility */ 


struct utmp | 


char ut user[ 32]; /* User login name x/ 

char vt id[14]; /* /etc/inittab id- IDENT LEN in init x/ 
char ut line[32]; /* device name(console, lnxx) */ | 

short ut type; /* type of entry x/ 

pid t ut pid; /* process id x/ 


struct exit status { 


short e termination; /* Process termination status x/ 
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short e exit; /* Process exit status x/ 
} ut exit; /* The exit status of a process marked as DEAD PROCESS x / 
time t ut time; /* Time entry was made x/ 
char ut_host[ 64]; /* Host name same as MAXHOSTNAMELEN */ 


); 
/* Definitions for ut type */ 
utmp. h(60 % ) 


略 过 所 有 介绍 性 的 内 容 , 直 接 来 看 utmp 结构 所 保存 的 登录 记录 。 它 包含 8 个 成 员 变 
量 ,ut_user 数组 保存 登录 名 ,ut_line 数组 保存 设备 名 ,也 就 是 用 户 的 终端 类 型 ,ut_time 保存 
登录 时 间 ,ut_host 保存 用 户 用 于 登录 的 远程 计算 机 的 名 字 。 

utmp 这 个 结构 所 包含 的 其 他 成 员 没 有 被 who 命令 所 用 到 。 

各 个 平台 上 的 utmp 结构 可 能 不 会 完全 相同 ,具体 的 内 容 由 utmp. h 来 决定 。 从 成 员 变 
量 来 看 , 其 中 的 绝 大 部 分 字段 在 大 多 数 的 Unix 平台 上 是 相同 的 ,被 标记 为 兼容 
(compatibility) 的 行 更 可 能 出 现 不 同 。 通 常 头 文件 中 的 注释 提供 了 一 些 有 用 的 信息 。 


who 的 工作 原理 


通过 阅读 who 和 utmp 的 联机 帮助 ,以 及 头 文件 /usr/include/utmp. h, 可 以 知道 who 的 
工作 原理 ,who 通过 读 文件 来 获得 需要 的 信息 ,而 每 个 登录 的 用 户 在 文件 中 都 有 对 应 的 记 
录 。who 的 工作 流程 可 以 用 图 2. 2 来 表示 。 


打开 utmp 


读 取 记录 
显示 记录 | 
关闭 utmp 





图 2. 2 who 命令 的 数据 流 


文件 中 的 结构 数组 存放 登录 用 户 的 信息 ,所 以 直接 的 想法 就 是 把 记录 一 个 一 个 地 读 出 
并 显示 出 来 ,是 不 是 就 这 么 简单 呢 ? 

虽然 没有 看 过 who 的 源 代码 ,但 从 联机 帮助 中 可 以 了 解 who 要 完成 的 功能 及 实现 原理 ， 
所 涉及 的 数据 结构 的 信息 也 可 以 从 头 文件 中 获取 。 接 下 来 是 实践 的 时 候 了 。 


2.5 问题 3: 如 何 编写 who 


接 下 来 要 编写 自己 的 who 程序 ,为 了 能 够 顺利 完成 ,需要 经 常 从 联机 帮助 中 获取 信息 。 
测试 程序 时 ,要 把 程序 的 输出 与 系统 who 命令 的 输出 做 比较 。 通 过 分 析 可 以 确认 ,在 编写 
who 程序 时 只 有 两 件 事 情 是 要 做 的 : 
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”从 文件 中 读 取 数 据 结构 
。 将 结构 中 的 信息 以 合适 的 形式 显示 出 来 


2.5.1 问题 : 如 何 从 文件 中 读 取 数据 结构 


可 以 调用 gete 和 fgets 函数 从 文件 中 读 字 符 或 字符 串 ,但 是 如 何 读 出 数据 结构 中 的 信息 
呢 ? 当然 可 以 用 getc 逐个 字 节 地 读 取 ,但 这 样 太 繁琐 ,而 且 效 率 很 低 。 要 找 一 种 可 以 一 次 读 
出 整个 数据 结构 的 方法 。 

还 是 到 联机 帮助 中 寻找 答案 ,可 以 找 那些 与 file 和 read 都 有 关 的 帮助 ,但 是 man 命令 的 
选项 一 k( 根 据 关 键 字 查找 ) 只 支持 一 个 关键 字 的 查找 。 在 我 的 系统 中 ,与 file 相关 的 主题 有 
537 个 ,如 果 一 个 一 个 地 来 看 ,这 就 太 慢 了 ,可 以 借助 Unix 命令 grep 来 从 这 537 个 主题 中 查 
找 与 read 相关 的 主题 : 


$ man ~k file | grep read 


 llseek (2) — reposition read/write file offset 
fileevent (n) — Execute a script when a channel becomes readable or writable 
gftype (1) - translate a generic font file for humans to read 
lseek (2) ~ reposition read/write file offset 
Macsave (1) — Save Mac files read from standard input 
read (2) — read from a file descriptor 
readprofile (1) ~ a tool to read kernel profiling information 
Scr dump, scr restore, scr init, scr set (3) — read (write) a curses screen 


from (to) a file 


tee (1) — read from standard input and write to standard output and files 


其 中 最 有 可 能 的 是 read 2» ,其 他 的 看 起 来 都 不 像 ;所 以 进一步 地 看 read(2) 的 帮助 : 


S man 2 read 


READ( 2) System calls READ(2) 
NAME 

Read — read from a file descriptor 
SYNOPSIS 


# include <Cunistd. h> 
ssize_t read(int fd, void x buf, size_t count); 

DESCRIPTION 
read() attempts to read up to count bytes from file descriptor fd into the buffer starting 
at buf. 
If count is zero, read() returns zero and has no other results. If count is greater than SSIZE 
MAX, the result is unspecified. 

RETURN VALUE 
On success, the number of bytes read is returned (zero indicates end of file), and the file 
position is advanced by this number. It is not an error if this number is smaller than the number 
of bytes requested; this may happen for example because fewer bytes are actually available 
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right now(maybe because we were close to end- of - file, or because we are reading from a pope, 
or from a terminal), or because read() was interrupted by a signal. On error, - 1 is returned, 
and errno is set appropriately. In this case it is left unspecified whether the file position(if 


any) changes. 


这 个 系统 调用 可 以 将 文件 中 一 定数 目的 字 节 读 人 一 个 缓冲 区 ,因为 每 次 都 要 读 人 一 个 
数据 结构 ,所 以 要 用 sizeof(struct utmp) 来 指定 每 次 读 人 的 字 节 数 。read 函数 需要 一 个 文件 
描述 符 作 为 输入 参数 ,如 何 得 到 文件 描述 符 呢 ? 在 read 的 联机 帮助 中 的 最 后 部 分 有 以 下 
描述 : 


RELATED INFORMATION(called SEE ALSO in some versions) 
Functions; fcntl(2), creat(2), dup(2), ioctl(2), getmsg(2), lockf(3), lseek(2), mtio(7), 
open(2), pipe(2), poll(2), socket(2), socketpair(2), termios(4),streamio(7),opendir(3), 
lockf(3) 
Standards; standards(5) 


其 中 包含 对 open(2) 的 引用 ,在 命令 行 输 入 : 
$ man 2 open 


查看 open 的 联机 帮助 ,从 open 中 又 可 以 找到 对 close 的 引用 ,通过 阅读 联机 帮助 ,可 以 知道 
以 上 3 个 系统 调用 都 是 进行 文件 操作 所 必需 的 。 


2.5.2 答案 : 使 用 open,read 和 close 


使 用 上 述 3 个 系统 调用 可 以 从 utmp 文件 中 取得 用 户 登 录 信息 ,这 3 个 系统 调用 的 联机 
帮助 会 包含 很 多 内 容 ,尤其 是 应 用 于 管道 .设备 和 其 他 数据 源 时 ,会 涉及 很 多 不 常用 的 选项 
以 及 复杂 的 用 法 ,但 在 这 里 ,只 需要 关心 它们 最 基本 的 用 法 。 

1. 打开 一 个 文件 : open 

这 个 系统 调用 在 进程 和 文件 之 间 建 立 一 条 连接 ,这 个 连接 被 称 为 文件 描述 符 , 它 就 像 一 
条 由 进程 通 向 内 核 的 管道 ,如 图 2. 3 所 示 。 


字符 数组 





图 2.3 文件 描述 符 是 对 文件 的 连接 


open 的 基本 用 法 如 下 。 
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open 


目标 打开 一 个 文件 
头 文件 # include <fentl, h> 
函数 原型 int fd = open(char x name, int how) 
参数 name 文件 名 | 
how O RDONLY, O WRONLY, or O RDWR 
返回 值 一 1 3B SE UR 
int 成 功 返回 





要 打开 一 个 文件 ,必须 指定 文件 名 和 打开 模式 ,有 3 种 打开 模式 ， 只 读 , 只 写 、 可 读 可 写 ， 
分 别 对 应 于 O RDONLY,O WRONLY.,O RDWR,3x fe 3. 3c (#/usr/include/fentl. h 中 有 

打开 文件 是 内 核 提 供 的 服务 ,如 果 在 打开 过 程 中 内 核 检测 到 任何 错误 ,这 个 系统 调用 就 
会 返回 一 1 。 

错误 类 型 是 各 种 各 样 的 ,如 : 要 打开 的 文件 不 存在 。 即 使 文件 存在 ,也 可 能 因为 权限 不 
够 而 无 法 打开 ,或 者 是 无 权 访 问 文件 所 在 的 目录 。 在 open 的 联机 帮助 中 列 出 了 各 种 可 能 的 
错误 ,本 章 结尾 还 会 进一步 讨论 出 错 处 理 的 问题 。 
| 当 一 个 文件 已 经 被 打开 ,是否 允许 再 次 打开 呢 ? 这 种 情况 发 生 在 有 多 个 进程 要 同时 访 
问 一 个 文件 的 时 候 。Unix 并 不 禁止 一 个 文件 同时 被 多 个 进程 访问 ,如 果 禁 止 的 话 , 那 两 个 用 
户 就 无 法 同时 使 用 who 命令 了 。 

如 果 文 件 被 顺利 打开 ,内 核 会 返回 一 个 正 整 数 的 值 ,这 个 数值 就 叫做 文件 描述 符 。 刚 才 
讲 过 ,打开 文件 会 建立 进程 和 文件 之 间 的 连接 ,文件 描述 符 就 是 用 来 惟一 标识 这 个 连接 的 ， 
如 果 同 时 打开 好 几 个 文件 ,它们 所 对 应 的 文件 描述 符 是 不 同 的 ,如 果 将 一 个 文件 打开 多 次 ， 
对 应 的 文件 描述 符 也 不 相同 。 

必须 通过 文件 描述 符 对 文件 进行 操作 。 

2. 从 文件 读 取 数据 ; read 

通过 read 晒 数 来 读 取 数据 ,read 的 用 法 如 下 : 


CC 


read 


目标 把 数据 读 取 到 缓冲 区 

头 文件 # include « unistd. h> 

函数 原型 ssize t numread = read(int fd, void * buf, size t qty) 
参数 fd 文件 描述 符 


buf 用 来 存放 数据 的 目的 缓冲 区 
qty 要 读 取 的 字 节 数 
一 ”一 
返回 值 一 1 遇 到 错误 
numread 成 功 读 取 
$$ $$ U 
read 这 个 系统 调用 请 求 内核 从 fd 所 指定 的 文件 中 读 取 qty 字 节 的 数据 ,存放 到 buf 


所 指定 的 内 存 空间 中 ,内 核 如 果 成 功 地 读 取 了 数据 ,就 返回 所 读 取 的 字 节 数目 ,否则 返 





。36 。 Unix/Linux 编程 实践 教程 


[n] —1, 

这 里 有 个 问题 ,就 是 最 终 读 到 的 数据 可 能 没有 你 所 要 求 的 那么 多 ,为 什么 呢 ? 可 能 是 因 
为 文件 中 剩余 的 数据 没有 要 求 的 那么 多 。 例 如 :程序 要 求 读 1000 字 节 的 数据 ,而 文件 的 长 度 
A 500 个 字 节 ,那么 程序 就 只 能 读 到 500 字 节 。 当 读 到 文件 末尾 时 再 要 读 的 话 ,numread 会 
是 0, 因 为 已 经 没有 数据 可 读 了 。 

调用 read 函数 时 可 能 会 遇 到 的 错误 在 联机 帮助 中 有 详细 的 描述 。 

3. 关闭 文件 : close 

当 不 需要 再 对 文件 进行 读 写 操作 时 ,就 要 把 文件 关闭 close 的 用 法 如 下 。 











close 
目标 关闭 一 个 文件 
头 文件 | # include <unistd. h> 
BR s Ie A int result = close(int fd) 
参数 fd 文件 描述 符 
, —1 ， 遇 到 错误 
EH 0 成 功 关 闭 





close 这 个 系统 调用 会 关闭 进程 和 文件 td 之 间 的 连接 ,如 果 关 闭 的 过 程 中 出 现 错误 ， 
close 返回 一 1 ,例如 : fd 所 指 的 文件 并 不 存在 。 其 他 可 能 遇 到 的 错误 在 联机 帮助 中 有 详细 的 
描述 。 
2.5.3 编写 whol.c 


到 目前 为 止 , 已 经 离 目标 很 近 了 ,明白 了 who 的 工作 原理 ,知道 了 要 先 打 开 文 件 , 然 后 读 
数据 ,最 后 关闭 文件 ,以 及 上 述 操作 所 需要 的 系统 调用 ,这 样 可 以 编写 如 下 代码 ， 


/x whol.c — a first version of the who program 
x open, read UTMP file, and show results 
x/ 

# include <(stdio. h> 

# include <utmp. h> 

it include <fentl. h> 

# include <unistd. h> 


# define SHOWHOST /* include remote machine on output */ 
int main() 
{ 

struct utmp | current record; /* read info into here x/ 

int utmpfd; /* read from this descriptor x/ 

int reclen - sizeof(current record); 

if ( Cutmpfd = open(UTMP FILE, O RDONLY)) == -1 )1 


perror( UTMP FILE ); /x UTMP FILE is in utmp. h */ 
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exit(1) ; 


H 
J 


while ( read(utmpfd, &current record, reclen) == reclen ) 


show info(&current record); 


close(utmpfd) ; 


return 0; /x went ok */ 


这 段 代 码 应 用 了 前 面 学 到 的 内 容 , 在 while 循环 内 从 文件 中 逐条 地 把 数据 读 取出 来 , 存 
放 在 记录 current. record 中 ,然后 调用 函数 show. info 把 登录 信息 显示 出 来 , 当 文 件 中 已 经 


没有 数据 时 ,循环 结束 ,最 后 关闭 文件 返回 。 


x HB J| Hj T PR perror, 这 是 一 个 系统 函数 ,使 用 这 个 函数 来 处 理 系统 报错 ,关于 错误 处 
理 在 本 章 结尾 还 会 讨论 。 


2.5.4 显示 登录 信息 
Pr show info 的 第 一 个 版 本 , 它 的 功能 是 显示 utmp 记录 的 内 容 : 


/* 


x show info() 


x xnotex these sizes should not be hardwired 


Show info( struct utmp x utbufp ) 


{ 


printf("€ -8.8s" 
printf ( " "y ; 
printf("% —8.8s" 


, 


f 


printf(" "); 
printf("% 101d", utbufp—>ut_time) ; 
printf(" "); | 


# ifdef SHOWHOST 


printf("( € s)", utbufp —»ut host); 


f 


# endif 


j 


printf("\n"); 


utbufp —^ut name); 


utbufp —^ut line); 


* displays contents of the utmp struct in human readable form 


/* the logname */ 
/x a space x/. 

/* the tty */ 

/* a space x/ 

/* login time x/ 


/x a space x/ 
/* the host x/ 


/* newline */ 


在 使 用 printf 函数 输出 时 ,使 用 了 定 宽 度 的 格式 ,这 样 做 是 为 了 与 系统 的 who 命令 的 输 
出 一 致 ,ut_time 字段 是 以 long int 的 格式 输出 的 ,在 头 文件 中 这 个 字段 被 定义 为 time. t 类 
型 ,但 到 目前 还 不 知道 time. t 类 型 的 数据 应 如 何 处 理 。 

将 上 述 代码 编译 .运行 ， 


$ cc whol.c - o whol 


S whol 
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system b 952601411 () 
run- leve 952601411 () 
952601416 () 

952601416 () 

952601417 © 

952601417 () 

952601419 () 

952601419 () 

952601423 () 

952601566 () 

LOGIN console 952601566 () 


ttypl 958240622 () 
shpyrko ttyp2 964318862 (nasi — 093. gas. swamp. org) 
acotton ttyp3 964319088 (math - guest04. williams. edu) 
ttyp4 964320298 () 
Spradlin ttyp5 963881486 (h002078c6adfb. ne. rusty. net) 
dkoh ttyp6 964314388 (128.103.223.110) 
Spradlin ttyp7 964058662 (h002078c6adfb. ne. rusty. net) 
king ttyp8 964279969 (blade - runner. mit. edu) 
berschba ttyp9 964188340 (dudley. learned. edu) 
rserved  ttypa 963538145 (gigue. eas. ivy. edu) 
dabel ttypb 964319455 (roam193 — 27. student. state. edu) 
ttypc 964319645 () 
rserved ttypd 963538287 (gigue. eas. ivy. edu) 
dkoh ttype 964298769 (128.103.223.110) 
ttypf 964314510 () 
molay ttyqO 964310621 (xyz73 — 200. harvard. edu) 
ttyqi 964311665 () 
ttyq2 964310757 () 
ttyq3 964304284 () 
ttyg4 964305014 () 
ttyq5 964299803 () 
ttyq6 964219533 () 
ttyq7 964215661 () 
cweiner  ttyq8 964212019 (roam175 — 157. student. stats. edu) 
ttyga 964277078 () 
ttyq9 964231347 () 


$ 


将 上 述 输出 与 系统 who 命令 的 输出 做 对 比 : 


$ who 

shpyrko ttyp2 Jul 22 22:21 (nasl - 093. gas. swamp. edu) 
acotton  ttyp3 Jul 22 22:24 (math - guest04. Williams. edu) 
spradlin ttyp5 Jul 17 20:51 (h002078c6adfb. ne. rusty. net) 
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dkoh ttyp6 Jul 22 21:06 (128.103.223. 110) 
spradlin ttyp? Jul 19 22:04 (n002078c6adfb. ne. rusty. net) 
king ttyp8 Jul 22 11:32 (blade ~ runner. mit. edu) 


berschba ttyp9 Jul 21 10:05 (dudley. learned. edu) 

rserved ttypa Jul 13 21 .29 (gigue. eas, ivy. edu) 

dabel ttypb Jul 22 22:30 (roam193 - 27. student, state. edu) 
rserved ttypd Jul 13 21;31 (gique. eas. harvard. edu) 

dkoh ttype Jul 22 16:46 (128.103.223.110) 

molay ttyg0 Jul 22 20:03 (xyz73 - 200. harvard. edu) 

cweiner  ttyq8 Jul 21 16:40 (roam175 — 157. student. stats. edu) 
$ 


自己 编写 的 who 已 经 可 以 工作 了 , 它 能 正确 显示 出 用 户 名 ,终端 名 .远程 主机 名 ,但 跟 系 
统 的 who 比 起 来 还 不 完善 ,至少 在 两 处 有 问题 。 

需要 改进 的 : 

。 消除 空白 记录 

。 正确 显示 登录 时 间 


2.5.5 编写 who2.c 


针对 版 本 1 的 两 个 问题 ,继续 编写 who 的 第 2 个 版 本 ,解决 问题 的 方法 还 是 通过 阅读 联 
机 帮助 和 头 文件 。 

1 消除 空白 记录 

系统 所 带 的 who 只 列 出 已 登录 用 户 的 信息 ,而 刚才 编写 的 who 1 除了 会 列 出 已 登录 的 
FP ,还 会 显示 其 他 的 信息 , 而 这 些 都 来 自 于 utmp 文件 。 实际 上 ump 包含 所 有 终端 的 信 
E ,甚至 那些 尚未 被 用 到 的 终端 的 信息 也 会 存放 在 utmp 中 ,所 以 要 修改 刚才 的 程序 ,做 到 能 
够 区 分 出 哪些 终端 对 应 活动 的 用 户 。 如 何 区 分 呢 ? 

一 种 简单 的 思路 是 过 滤 掉 那些 用 户 名 为 空 的 记录 ,但 这 样 做 是 有 问题 的 ,如 刚才 的 输出 
中 ,用 户 名 为 LOGIN 的 那 一 行 对 应 的 是 控制 台 , 而 不 是 一 个 真实 的 用 户 。 最 好 有 一 种 方法 
能 够 指出 某 一 条 记录 确实 对 应 着 已 登录 的 用 户 。 

f£ / usr/include/utmp. h 中 ,有 了 以 下 内 容 ， 


/* Definitions for ut type x/ 


+ define EMPTY 0 
# define RUN LVL 1 
# define BOOT_TIME 2 
# define OLD TIME 3 
并 define NEW TIME 4 
# define INIT PROCESS 5 
# define LOGIN PROCESS 6 
# define USER_PROCESS | 7 
~ #define DEAD PROCESS 8 


/* Process spawned by "init" */ 
/x A "getty" process waiting for login x/ | 


/x A user process x/ 
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utmp 结构 中 有 一 个 成 员 ut_type, 当 它 的 值 为 7(USER_PROCESS) 时 ,表示 这 是 一 个 已 
经 登录 的 用 户 。 根 据 这 一 点 ,对 原来 的 程序 做 以 下 修改 ,就 可 以 消除 空白 行 : 


show info( struct utmp x utbufp ) 
( 


if ( utbufp —»ut type !- USER PROCESS ) /* users only */ 
return; 
printf("% —8.8s", utbufp —»ut name); /* the username x/ 


2. 以 可 读 的 方式 显示 登录 时 间 
接 下 来 要 处 理 的 是 时 间 显示 的 问题 ,要 把 时 间 以 易于 理解 的 形式 显示 。 还 是 需要 借助 
联机 帮助 和 头 文件 。 在 联机 帮助 中 关于 时 间 的 主题 很 多 ,在 命令 行 输入 : 


$ man ~ k time 


会 返回 很 多 条 记录 ,我 曾 在 某 个 Unix 系统 上 得 到 73 条 记录 ,而 在 另 一 个 Unix 系统 上 得 到 
了 97 条 。 当 然 可 以 瞪 着 眼珠 一 条 一 条 地 看 ,不 过 用 Unix 自 带 的 工具 来 过 滤 出 有 用 的 东西 
是 一 个 更 好 的 方法 。 以 下 是 两 种 过 滤 方 法 : 


$ man -k time | grep transform 


$ man -k time | grep - i convert 


很 多 记录 都 涉及 到 /usr/include/time. h 这 个 头 文件 ,这 里 面 有 很 多 有 用 的 信息 。 

(1) Unix 存储 时 间 的 方式 : time_t 数据 类 型 

Unix 中 时 间 是 用 一 个 整数 来 表示 的 , 它 的 数值 是 从 1970 年 1 月 1 日 0 时 开始 所 经 过 的 
秒 数 , 在 头 文件 time. h 中 有 以 下 内 容 : | 


typedef long int time t; 


存储 时 间 的 结构 time t 实际 上 就 是 long int, 

(2) 将 time t 显示 出 来 : ctime 

ctime 将 表示 时 间 的 整数 值 转换 成 人 们 日 常 所 使 用 的 时 间 形 式 。 在 联机 帮助 的 第 3 节 有 
ctime 的 详细 说 明 : 


$ man 3 ctime 
CTIME(3) Linux Programmers Manual CTIME(3) 


NAME 


asctime, ctime, gmtime, localtime, mktime ~ transform binary date and time to ASCII 


SYNOPSIS 
+ include «time. h> 
char * asctime(const struct tm * timeptr); 
char x ctime(const time t x timep); 
struct tm x gmtime(const time t x timep); 


struct tm x localtime(const time t x» timep); 
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time t mktime(struct tm x timeptr); 


extern char x tzname[2]; 
long int timezone; 


extern int daylight; 


DESCRIPTION 
The ctime(), gmtime() and localtime() functions all take an argument of data type time t which 
represents calendar time. When interpreted as an absolute time value, it represents the number 


of seconds elapsed since 00:00:00 on January 1, 1970, Coordinated Universal Time (UTC). 
The ctime() function converts the calendar time timep into a string of the form 
"Wed Jun 30 21:49:08 1993\n" 


The abbreviations for the days of the week are Sun, Mon, Tue, Wed, Thu, Fri, and Sat. The 
abbreviations for the months are Jan, Feb, Mar, Apr, May, Jun, Jul, Aug, Sep, Oct, Nov, and Dec. 
The return value points to a statically allocated string which might be overwritten by 


subsequent calls to any of the date and time functions. The function also 


这 正 是 所 需要 的 ,在 utmp 结构 中 有 一 个 time t 类 型 的 数据 ,而 最 终 需 要 的 是 类 似 于 以 
下 的 输出 : 


Jun 30 21:49 


ctime(3) PR 22 A — ^I f [8] time. t 的 指针 ,返回 的 时 间 字 符 串 类 似 于 以 下 格式 : 


Wed Jun 30 21 :49 :08 1993\n 


AAAAAAAAAA AAA 


注意 : FPA AT BÜTAN BAN AB is SE ee EA HA RRR RA Be P ORR 
很 容易 处 理 了 ,将 ctime 返回 的 字符 串 从 第 4 个 字符 开始 ,输出 12 个 字符 : 


printf("%12.12s",ctime(&t) + 4) 


3. 把 刚才 学 的 两 点 综合 起 来 
现在 明白 了 如 何 消除 空 日 记录 和 如 何 正 确 地 显示 ut time 中 的 时 间 值 ,可 以 着 手 重新 编 
tj who2.c 如 下 : 


/x who2.c - read /etc/utmp and list info therein 


x — suppresses empty records 
* — formats time nicely 
x/ 


# include <stdio.h> 
# include <cunistd. h> 
# include <cutmp. h> 

# include <fentl. h> 
# include < time. b> 


2- 
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/* #define SHOWHOST «/ 


void showtime(long); 


void show info(struct utmp *); 


int main() 
( 
struct utmp  utbuf; /* read info into here x/ 
int utmpfd; /x read from this descriptor x/ 
if ( (utmpfd = open(UTMP FILE, O RDONLY)) == -1 ){ 
perror(UTMP FILE); 
exit(1); 
j 
while( read(utmpfd, &utbuf, sizeof(utbuf)) == sizeof(utbuf) ) 
show info( &utbuf ); 
close(utmpfd) ; 
return 0; 
j 
/* 
* show info() 
* displays the contents of the utmp struct 
x in human readable form 
x * displays nothing if record has no user name 
*/ 


void show info( struct utmp x utbufp ) 


( 
if ( utbufp —»ut type != USER PROCESS ) 


return; 


printf("%* —8.8s", utbufp —»ut name); /* the logname x/ 


printf(" "); /* a space x/ 


printf("* —8.8s", utbufp--—»ut line); /* the tty x/ 


F 


printf (t "); /* a space x/ 
showtime( utbufp —»ut time); /* display time x/ 
# ifdef SHOWHOST 
if ( utbufp —»ut host[0] t= 'X0' ) 
printf(" (& s)", utbufp —-ut host); /* the host x/ 
# endif 
printf("\n"); /* newline x/ 


void showtime( long timeval ) 
/* 


* displays time in a format fit for human consumption 
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who 


* uses ctime to build a string then picks parts out of it 
x Note; $ 12.12s prints a string 12 chars wide and LIMITS 
* it to 12chars. 


*/ 


char * cp 


cp = ctime(&timeval); 


/* to hold address of time «/ 

/* convert time to string */ 

/* string looks like x/ 

/* Mon Feb 4 00:46:40 EST 1991 «/ 
/* 0123456789012345. x/ 


printf("%12.12s", cp t 4 ); /x pick 12 chars from pos 4 x/ 


4. 测试 who2.c 
为 了 便于 对 比 , 先 关 掉 SHOWHOST 这 个 选项 ,编译 who2. c 将 其 结果 与 系统 所 带 的 
进行 比较 : 


S cc who2.c - o who2 


$ who2 
rlscott 
acotton 
spradlin 
spradlin 
king 
berschba 
rserved 
rserved 
molay 
cweiner 


mnabavi 


$ who 
rlscott 
acotton 
Spradlin 
spradlin 
king 
berschba 
rserved 
rserved 
molay 
cweiner 


mnabavi 
S 


ttyp2 Jul 23 
ttyp3 Jul 22 
ttyp5 Jul 17 
ttyp? Jul 19 
ttyp8 Jul 22 
ttyp9 Jul 21 
ttypa Jul 13 
ttypd Jul 13 
ttyqO Jul 22 
ttyq8 Jul 21 
ttyx2 Apr 10 


ttyp2 Jul 23 
ttyp3 Jul 22 
ttyp5 Jul 17 
ttyp? Jul 19 
ttyp8 Jul 22 
ttyp9 Jul 21 
ttypa Jul 13 
ttypd Jul 13 
ttyqO Jul 22 
ttyq8 Jul 21 


01 
22 
20 
22 


22 
20 
22 


10 
21 
21 
20 
16 


ttyx2 Apr 10 23 


: 07 
:24 
:51 
:04 
.32 
:O05 
:29 
:31 
:03 
:40 
:11 


:07 
:24 
:51 
:04 
:32 
:05 
:29 
:31 
:03 
:40 
:11 
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将 who2 与 系统 的 who 对 比 一 下 ,除了 某 些 字 段 的 宽度 有 些 不 同 外 ,其 他 的 都 完全 一 致 ， 
而 要 调整 宽度 也 是 很 容易 的 。 

这 里 的 who 只 列 出 了 3 个 字段 : 用 户 名 .终端 类 型 和 登录 时 间 ,有些 版 本 的 who 还 会 列 
出 用 户 所 在 主机 的 信息 ,这 个 功能 在 who2 中 通过 预 编译 选项 SHOWHOST 控制 。 


2.5.6 回顾 与 展望 


这 一 章 是 从 这 样 一 个 简单 的 问题 开始 的 : Unix 的 who 命令 是 如 何 工作 的 ? 接 下 来 分 3 
步 走 , 和 首先 弄 清 who 的 功能 ,然后 通过 联机 帮助 和 头 文件 知道 了 who 的 工作 原理 ,最 后 ,通过 
编写 自己 的 who 来 检验 对 知识 的 掌握 程度 。 

在 这 3 步 中 ,学 习 了 如 何 使 用 联机 帮助 ,如何 使 用 头 文 件 , 了解 了 记录 登录 信息 的 utmp 
文件 的 结构 ,知道 了 Unix 处 理 时 间 的 方式 ,学 会 了 通过 相关 主题 来 获取 信息 ,这 些 知 识 对 掌 
fe Unix 编程 是 很 重要 的 。 通 过 编写 程序 ,更 加 深化 了 对 知识 的 理解 和 掌握 。 


2.6 编号 cp( 谈 和 写 ) 
在 who 命令 中 介绍 了 如 何 读 文件 , 接 下 来 要 通过 cp 命令 来 学 习 如 何 写 文件 。 
2.6.1 问题 1: cp 命令 能 做 些 什 么 
cp 能 够 复制 文件 ,典型 的 用 法 是 : 
$ cp source - file target - file 


如 果 target- file 所 指定 的 文件 不 存在 ,cp 就 创建 这 个 文件 ,如 果 已 经 存在 就 覆盖 ,target 
-file HAAS source- file 相同 。 


2.6.2 问题 2: cp 命令 是 如 何 创 建 / 重 写 文件 的 


1. 创建 / 重 写 文 件 
创建 或 重 写 文件 的 一 种 方法 是 使 用 系统 调用 函数 creat, creat 的 用 法 如 下 : 


creat 


目标 创建 / 重 写 一 个 文件 
头 文件 # include < fentl. h> 
函数 原型 int fd — creat(char * filename, mode t mode) 
参数 filename ”文件 名 
mode 访问 模式 
返回 值 一 1 遇 到 错误 
fd 成 功 创建 


creat 告诉 内 核 创建 一 个 名 为 filename 的 文件 ,如 果 这 个 文件 不 存在 ,就 创建 它 ,如 果 已 
经 存在 ,就 把 它 的 内 容 清空 ,把 文件 的 长 度 设 为 0。 
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如 果 内 核 成 功 地 创建 了 文件 ,那么 文件 的 许可 位 (permission bits) 被 设置 为 由 第 2 TE 
数 mode 所 指定 的 值 ,如 : 


fd = creat("addressbook",0644); 


创建 一 个 名 为 addressbook 的 文件 , 如 果 文 件 不 存在 ,那么 文件 的 许可 位 被 设 为 
rw-r-r--《 参 见 第 3 章 )。 如 果 文 件 已 经 存在 , 它 的 内 容 会 被 清空 。 任 一 种 情况 下 ,fd 都 会 是 
指 问 addressbook 的 文件 描述 符 。 

2. 写 文件 

用 write 系统 调用 向 已 打开 的 文件 中 写 人 数据 。 


write 

目标 将 内 存 中 的 数据 写 人 文件 
头 文 件 # include «unistd, h> 
BR Er m 99 ssize t result — write(int fd, void * buf, size t amt) 
参数 fd 文件 描述 符 

buf 内 存 数据 

amt | 要 写 的 字 节 数 
返回 值 —1 遇 到 错误 


num written 成 功 写 人 


write 这 个 系统 调用 告诉 内 核 将 内 存 中 指定 的 数据 写 和 人 文件, 如果 内 核 不 能 写 人 或 写 人 
失败 ,write 返回 一 1, 如 果 写 人 成 功 , 则 返回 写 人 的 字 节 数 。 

为 什么 实际 写 人 的 字 节 数 会 少 于 所 要 求 的 呢 ? 有 两 个 原因 ,第 一 个 是 有 的 系统 对 文件 
的 最 大 尺寸 有 限制 ,第 二 个 是 磁盘 空间 接近 满 了 。 在 上 述 两 种 情况 下 ,内 核 都 会 尽量 把 数据 
ESCHER ES ,并 将 实际 写 人 的 字 节 数 返 回 ,所 以 调用 write 后 都 必须 检查 返回 值 是 否 与 要 写 
和 人 的 相同 ,如 果 不 同 ,就 要 采取 相应 的 措施 。 


2.6.3 问题 3: 如 何 编写 cp 
下 面 通过 编写 一 个 实际 的 cp 来 检查 对 知识 的 理解 ,程序 的 流程 如 下 : 


open sourcefile for reading 
open copyfile for writing 
+—>read from source to buffer -- eof? 一 十 


| | write from buffer to copy | 


close sourcefile < + 


close copyfile 


图 2.4 显示 了 涉及 的 对 象 及 数据 流 的 走向 。 
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文件 在 磁盘 上 , 源 文 件 在 左边 ,右边 的 是 目标 文件 ,进程 在 用 户 空间 ,缓冲 区 是 进程 内 存 
的 一 部 分 ,进程 有 两 个 文件 描述 符 , 一 个 指向 源 文 件 , 一 个 指向 目标 文件 ,从 源 文件 中 读 取 数 





图 2.4 通过 读 和 写 来 复制 文件 


据 写 入 缓冲 ,再 将 缓冲 中 的 数据 写 入 目标 文件 。 下 面 就 是 实现 上 述 逻 辑 的 代码 : 


/** Cpl.c 


* version 1 of cp - uses read and write with tunable buffer size 


* usage: cpl src dest 


# include <stdio.h> 
# include <unistd.h> 
# include <fcentl.h> 


# define BUFFERSIZE 4096 
# define COPYMODE 0644 


void oops(char * , char *); 


main(int ac, char x av[]) 


{ 


int in_fd, out_fd, n_chars; 
char buf [BUFFERSIZE]; 

/* check args x/ 
if (ac l= 3 ){ 


fprintf( stderr, "usage: % s source destination\n", * av); 
exit(1) s 
j 
/* open files x/ 
if ( Cin fd= open(av[1], O RDONLY)) == -1) 


oops( "Cannot open ", av[1]); 


if ( (out fd- creat( av[2], COPYMODE)) == -1) 
oops( "Cannot creat", av[2]); 
/* copy files x/ 
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while ( (n chars = read(in fd , buf, BUFFERSIZE)) > 0) 
if ( write( out fd, buf, n chars ) 1= n chars ) 
oops("Write error to", av[2]); 
if(n chars == -1) 
oops( "Read error from ", av[1)); 


/x close files «/ 


if ( close(in fd) == -1 || close(out fd) == -1) 
oops("Error closing files",""); 


void oops(char xsl, char x s2) 

| | 
fprintf(stderr,"Error;: %s ", sl); 
perror(s2); 
exit(1); 

j 


编译 并 测试 上 述 代码 : 


$ cc cpl.c -o cpi 

$ cpl cpl copy. of. cpl 

S ls - 1 cpl copy. of. cpl 

-rw-r--r-- 1 bruce bruce 37419 Jul 23 03:12 copy. of. cpl 
-rwxrwxr-x 1 bruce bruce 37419 Jul 23 03:08 cpl 

$ cmp cpl copy. of. cpl 

S 


用 Unix 所 带 的 文件 比较 工具 cmp 对 上 述 两 个 文件 的 内 容 做 比较 。emp 没有 给 出 任何 
提示 ,说 明 它们 的 内 容 完全 相同 。 
接 下 来 看 看 程序 对 错误 输入 的 反映 ,在 命令 行 输入 ， 


$ cpl xxx123 filel 

Error; Cannot open xxx123; No such file or directory 
$ cpl cpi /tmp 

Error; Cannot creat /tmp; Is a directory 


阅读 与 系统 调用 相关 的 联机 帮助 ,看 看 还 有 什么 错误 可 能 发 生 , 逐 一 地 测试 这 些 错误 情 
况 。 注 意 不 要 覆盖 掉 那 些 想 要 保存 的 文件 。 


2.6.4 Unix 编程 看 起 来 好 像 很 简单 


who 命令 从 文件 中 读数 据 然后 以 一 定 的 格式 输出 ,cp 命令 从 一 个 文件 中 读数 据 然 后 写 
入 到 为 外 的 文件 中 ,它们 用 到 的 是 类 似 的 系统 调用 ,都 是 在 内 存 和 文件 之 间 交 换 数据 ,可 以 
从 联机 帮助 和 头 文件 中 得 到 足够 的 信息 来 进行 编程 。 

这 样 看 来 , Unix 编程 好 像 真 的 不 难 ,是 不 是 还 有 些 东西 没 涉 及 到 ? 答案 是 肯定 的 ,还 记 
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不 记得 那 3 个 问题 ? 在 这 里 要 多 问 一 个 问题 : 如 何 使 你 的 程序 运行 得 更 加 有 效 ? 
2.7 提高 文件 1/0 效率 的 方法 : 使 用 缓冲 


cpl 中 定义 了 BUFFERSIZE 这 个 常量 ,用 于 标识 每 次 读 / 写 操作 的 数据 长 度 , 这 里 的 值 
是 4096 , 接 下 来 是 个 很 重要 的 问题 : 缓冲 区 的 大 小 对 性 能 有 影响 吗 ? 


2.7.1 组 冲 区 的 大 小 对 性 能 的 影响 


缓冲 区 的 大 小 对 性 能 有 很 大 的 影响 ,举例 来 说 ,用 勺子 把 汤 从 一 个 碗 里 菠 到 另 一 个 碗 
里 ,用 较 大 的 勺子 就 可 以 少 画 几 次 ,从 而 节省 时 间 。 
对 文件 操作 而 言 也 是 这 样 的 ,来 看 对 一 个 2500 字 节 的 文件 的 copy HEE: 


文件 大 小 = 2500 字 节 
如 果 缓 冲 区 大 小 = 100 字 节 

那么 需要 25 次 read() 和 25 次 writeO 
如 果 缓冲 区 大 小 = 1000 字 节 

那么 需要 3 次 readO fl 3 次 writeO 


把 缓冲 区 从 100 字 节 增加 到 1000 字 节 会 使 系统 调用 的 次 数 从 50 次 减少 到 6 次 ,这 确实 
很 可 观 。 
复制 一 个 5MB 大 小 的 文件 ,不 同 的 缓冲 区 所 对 应 的 执行 时 间 如 下 


缓冲 大 小 执行 时 间 /s 
] 50. 29 
4 | 12. 81 
16 3. 28 
32 0. 96 
128 0. 56 
256 0. 37 
512 0. 27 
1024 0. 22 
2048 0. 19 
4096 0. 18 
8192 0. 18 
16384 0. 18 


-一 人” 0 
系统 调用 是 需要 时 间 的 ,程序 中 频繁 的 系统 调用 会 降低 程序 的 运行 效率 。 
2.7.2. 为 什么 系统 调用 需要 很 多 时 间 


为 什么 系统 调用 会 消耗 很 多 时 间 ? 参见 图 2. 5 所 示 的 控制 流程 。 
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图 2.5 系统 调用 时 的 控制 流 图 


图 2.5 中 用 户 进程 位 于 用 户 空间 ,内 核 位 于 系统 空间 ,磁盘 只 能 被 内 核 直接 访问 。 程序 
cpl 要 读 取 磁盘 上 的 数据 只 能 通过 系统 调用 read ,而 read 的 代码 在 内 核 中 ,所 以 当 read 调用 
发 生 时 ,执行 权 会 从 用 户 代码 转移 到 内 核 代 码 ,执行 内 核 代码 是 需要 时 间 的 。 

系统 调用 的 开销 大 不 仅仅 是 因为 要 传输 数据 , 当 运 行内 核 代码 时 ,CPU 工作 在 管理 员 
(supervisor, 又 称 超级 用 户 ) 模 式 , 这 对 应 于 一 些 特殊 的 堆栈 和 内 存 环境 ,必须 在 系统 调用 发 
后 时 建立 好 。 系 统 调用 结束 后 (read 返回 时 ),CPU 要 切换 到 用 户 模式 ,必须 把 堆栈 和 内 存 环 
境 恢复 成 用 户 程序 运行 时 的 状态 ,这 种 运行 环境 的 切换 要 消耗 很 多 时 间 。 

当 工 作 在 管理 员 模式 下 ,程序 可 以 直接 访问 磁盘 :终端 .打印 机 等 设备 ,还 可 以 访问 全 部 
的 内 存 空间 ,而 在 用 户 模式 ,程序 不 能 直接 访问 设备 ,也 只 能 访问 特定 部 分 的 内 存 空间 。 在 
运行 时 刻 ,系统 会 根据 需要 不 断 地 在 两 种 模式 间 切 换 。 管理 员 模 式 和 用 户 模式 的 切换 与 
CPU 关系 很 大 ,CPU 中 有 特定 的 标记 来 区 分 当前 的 工作 模式 ,而 Unix 系统 的 设计 必须 考虑 
到 CPU 的 这 种 特点 ,才能 够 实现 不 同 工 作 模式 间 的 良好 切换 。 

类 个 影片 超人 的 例子 , 当 肯 特 ( 生 活 中 的 超人 ) 要 从 用 户 模式 (普通 人 ) 切 换 到 管理 员 杷 
式 ( 超 人 ) 时 ,他 得 先 找 个 地 方 ， 比如 电话 亭 , 脱 下 西装 , 摘 掉 眼镜 ,再 改变 发 型 , 变 成 超人 后 才 
能 去 拯救 别人 ,事情 完了 以 后 ,还 得 找 个 地 方 变 回 普通 人 。 变 来 变 去 是 需要 时 间 的 ,要 是 肯 
特 整 天 忙于 变 来 变 去 ,就 不 会 有 太 多 的 时 间 来 抒 救 人 类 了 ，。 

在 计算 机 的 世界 中 也 是 一 样 ,要 是 CPU 把 太 多 的 时 间 消 耗 在 执行 内 核 代 码 和 模式 切换 
上 ,就 不 可 能 有 很 多 时 间 来 执行 程序 中 业务 逻辑 的 代码 或 提供 系统 服务 ,所 以 要 尽 可 能 地 减 
少 模式 间 的 切换 。 对 系统 来 说 这 种 时 间 上 的 开销 是 昂贵 的 ,那么 who 版 本 花费 在 读 、 写 数据 
的 时 间 开 销 有 多 大 呢 ? | | 


2.7.3 {KRY who2.c 
每 次 从 utmp 中 读 出 一 条 记录 ,就 如 同 要 前 3 个 荷包 蛋 , 每 次 到 超市 去 买 一 个 鸡蛋 ,前 好 
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了 再 去 买 一 个 ,这 是 很 低 效 率 的 方法 ,完全 可 以 一 次 把 3 个 鸡蛋 都 买 回来 。 对 于 who 而 言 ， 
可 以 一 次 读 入 多 个 记录 放 在 缓冲 区 中 ,下 面 是 实现 上 述 想法 的 伪 代 码 : 


getegg() { 

if ( eggs left in carton == 0) 
refill carton at store 
if ( eggs at store -- 0) 

return EndOfEggs 

j 

eggs left in carton-- ; 

return one egg; 


j 


getegg 的 每 次 调用 会 从 篮子 里 拿 一 个 鸡蛋 ,而 不 是 每 次 都 要 到 超市 去 买 , 只 有 当 篮 子 空 
了 才 需 要 去 超市 。 
参见 /usr/include/stdio. h 中 getc 的 代码 ,getc 的 实现 使 用 了 与 getegg 类 似 的 算法 。 


2.7.4 在 who2.c 中 运用 缓冲 技术 


在 who2.c 中 加 入 缓冲 机 制 可 以 提高 程序 的 运行 效率 , 接 下 来 要 把 getegg 中 的 想法 用 代 
码 实 现 , 如 图 2.6 所 示 。 


用 utmplib 来 缓冲 
main 函数 调用 utmplib. c 中 的 函数 来 取 
得 下 一 条 utmp 记录 


utmplib. c 中 定义 的 函数 每 次 从 文件 中 读 
取得 6 条 记录 放 人 数组 中 


当 数 组 中 的 6 条 记录 都 被 取 走 后 , 才 调 用 
内 核 服务 重新 读 取 数 据 





图 2.6 在 用 户 空间 数据 加 入 磁盘 缓冲 


用 一 个 能 容纳 16 个 utmp 结构 的 数组 作为 缓冲 区 ,在 图 2. 6 中 标识 为 buffer, 就 像 你 一 
次 会 买 很 多 个 鸡蛋 一 样 ,buffer 可 以 存放 很 多 数据 。 编 写 utmp_next 函数 来 从 缓冲 区 中 取得 
下 一 个 utmp 结构 的 数据 。 

修改 原来 的 主 函 数 main, 通 过 调用 utmp_next 来 取得 数据 , 当 缓 冲 区 的 数据 都 被 取出 
后 ,utmp_next 会 调用 read, 通 过 内 核 再 次 获得 16 条 记录 充满 缓冲 区 。 用 这 种 方法 可 以 使 
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read 的 调用 次 数 减 少 到 原来 的 1/16. 


以 上 算法 在 utmplib. c 中 加 以 实现 。 


/* utmplib.c - functions to buffer reads from utmp file 


* 


x functions are 

* utmp open( filename ) — open file 

x returns - l on error 

x utmp next( ) - return pointer to next struct 
* returns NULL on eof 

* utmp close() ~ close file 

* 

x reads NRECS per read and then doles them out from the buffer 
x/ 


# include <stdio.h> 

# include — «fcntl.h— 

# include <sys/types.h> 
f include < utmp. h> 


i define NRECS 16 
# define NULLUT ((struct utmp x )NULL) 
+ define UTSIZE (sizeof(struct utmp)) 


static char | utmpbuf[NRECS x UTSIZE]; 


static int num recs; 
static int cur rec; 
static int fd utmp = - 1; 


utmp open( char x filename ) 


{ 


fd utmp = open( filename, O RDONLY ); 


cur rec - num recs - O0; 


return fd utmp; 


struct utmp x utmp next() 
{ 
struct utmp * recp; 
if ( fd utmp == -1) 
return NULLUT; 


if ( cur rec == num recs && utmp reload() ==0 ) 


return NULLUT; 


recp = ( struct utmp * ) &utmpbuf[cur rec x UTSIZE]; 


cur rec t+, 


return recp; 


/* 
/* 
/* 
/* 


/* 
/* 
/* 


/* 


/* 


storage x/ 
num stored x/ 
next to go */ 


read from x/ 


open it */ 
no recs yet x/ 


report x/ 


error ? x/ 


any more ? x/ 


get address of next record x/ 


ol 
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int utmp reload() 
/* 


*x read next bunch of records into buffer 


*/ 
{ 


int amt_read; 


amt read = read( fd utmp , utmpbuf, NRECS x UTSIZE ); 


num recs - amt read/UTSIZE; 
cur rec = 0; 
return num recs; 


utmp close() 
{ 
if ( fd utmp != -1) 
close( fd utmp ) ， 


utmplib. c 包含 使 用 缓冲 区 所 需 的 变量 和 函数 ,变量 num. recs 记录 了 缓冲 区 中 的 数据 
个 数 , 变 量 cur rec 记录 了 缓冲 区 中 已 被 使 用 的 数据 的 个 数 。 

每 次 要 从 缓冲 区 中 读数 据 前 , 先 检查 cur rec 的 值 是 否 等 于 num_recs, 如 果 相 等 说 明 组 
冲 区 中 已 经 没有 可 用 数据 了 ,就 调用 read 从 硬盘 上 读数 据 来 填 满 缓冲 区 ,在 返回 数据 前 , 增 


加 cur rec 的 值 。 


PR. utmp_next 返回 指向 结构 的 指针 ,utmplib. c 隐藏 了 实现 细节 ,提供 简单 清晰 的 操 


作 缓 冲 区 的 接口 。 
下 面 是 修改 后 的 main: 
/x who3.c — who with buffered reads 
* ~ Surpresses empty records 
* — formats time nicely 
x - buffers input (using utmplib) 
x/ 


# include <stdio.h> 

# include <sys/types.h> 
# include <Cutmp. h> 

# include <¢fcntl.h> 

# include «time. h> 


+ define SHOWHOST 


void show info(struct utmp x) 


* 
F 


void showtime(time t); 


/* read them in x/ 
/* how many did we get? x/ 


/* reset pointer x/ 


/* don't close if not x/ 


/x open x/ 
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int main() 


( 


struct utmp * utbufp, /* holds pointer to next rec x/ 


x utmp next(); /* returns pointer to next */ 


if ( utmp open( UTMP FILE ) == -1 ){ 
perror(UTMP FILE); 
exit(1); 
} 
while ( ( utbufp = utmp next() ) != ((struct utmp * ) NULL) ) 
show info( utbufp ); 
utmp close( ); 
return 0; 
j 
/* 
* show info() 


修改 后 的 主 函 数 没 有 直接 对 open. read 和 close 进行 调用 ,而 是 调用 与 之 等 价 的 具有 组 
冲模 式 的 函数 接口 。 用 于 显示 的 函数 show. info 没有 受到 任何 影响 。 


2.8 内 核 缓冲 技术 
应 用 缓冲 技术 对 提高 系统 的 效率 是 很 明显 的 , 它 的 主要 思想 是 一 次 读 人 大 量 的 数据 放 
入 缓冲 区 ,需要 的 时 候 从 缓冲 区 取得 数据 。 


内 核 使 用 缓冲 吗 


管理 员 模式 和 用 户 模式 之 间 的 切换 需要 消耗 时 间 , 相 比 之 下 ,磁盘 的 L/O 操作 消耗 的 时 
间 更 多 ,为 了 提高 效率 ,内 核 也 使 用 缓冲 技术 来 提高 对 磁盘 的 访问 速度 ,如 图 2.7 Pra. 





内 核 缓冲 区 (位 于 系统 空间 ) 


2.7 内 核 缓冲 磁盘 上 的 数据 
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正如 utmp 文件 是 用 户 登 录 记 录 的 集合 ,磁盘 是 数据 块 的 集合 ,内 核 会 对 磁盘 上 的 数据 
块 作 缓冲 ,就 像 who 程序 缓冲 utmp 记录 一 样 。 内 核 将 磁盘 上 的 数据 块 复制 到 内 核 缓 冲 区 
中 , 当 一 个 用 户 空 间 中 的 进程 要 从 磁盘 上 读数 据 时 ,内 核 一 般 不 直接 读 磁 盘 , 而 是 将 内 核 组 
冲 区 中 的 数据 复制 到 进程 的 缓冲 区 中 。 

当 进 程 所 要 求 的 数据 块 不 在 内 核 缓冲 区 时 ,内 核 会 把 相应 的 数据 块 加 入 到 请 求 数据 列 
表 中 ,然后 把 该 进程 挂 起 ,接着 为 其 他 进程 服务 。 

一 段 时 间 之 后 (很 短 ) ,内 核 把 相应 的 数据 块 从 磁盘 读 到 内 核 缓冲 区 ,然后 再 把 数据 复制 
到 进程 的 缓冲 区 中 ,最 后 唤醒 被 挂 起 的 进程 。 

理解 内 核 缓 冲 技术 的 原理 有 助 于 更 好 地 掌握 系统 调用 read 和 write, read 把 数据 从 内 核 
缓冲 区 复制 到 进程 缓冲 区 , write 把 数据 从 进程 缓冲 区 复制 到 内 核 缓冲 区 ,它们 并 不 等 价 于 数 
据 在 内 核 缓冲 和 磁盘 之 间 的 交换 。 

从 理论 上 讲 , 内 核 可 以 在 任何 时 候 写 磁盘 ,但 并 不 是 所 有 的 write 操作 都 会 导致 内 核 的 
号 动作 。 内 核 会 把 要 写 的 数据 暂时 存在 缓冲 区 中 ,积累 到 一 定数 量 后 再 一 次 写 信 。 有 时 会 
导致 意外 情况 ,比如 突然 断 电 ,内 核 还 来 不 及 把 内 核 缓冲 区 中 的 数据 写 到 磁盘 上 ,这 些 更 新 
的 数据 就 会 丢失 。 

应 用 内 核 缓冲 技术 导致 的 结果 : 

。 提高 磁盘 IO 效率 
© 优化 磁盘 的 写 操作 
* 需要 及 时 地 将 缓冲 数据 写 人 磁盘 


2.9 文件 谈 写 


who 是 从 文件 读数 据 ,cp 从 一 个 文件 读数 据 写 人 到 另 一 个 文件 中 ,会 不 会 有 对 同一 个 文 
件 既 读 又 写 的 情况 呢 ? 


2.9.1 注销 过 程 : 做 了 些 什么 


在 注销 过 程 中 ,系统 改变 了 文件 utmp 中 相应 的 登录 记录 ,从 whol 的 输出 可 以 看 出 文件 
utmp 中 还 包含 那些 未 被 使 用 的 终端 的 信息 ,通过 实验 来 看 这 个 过 程 ， 

l. 分 别 从 两 个 窗口 登录 到 一 个 Unix 系统 中 。 

2. 运行 前 面 编 写 的 whol 程序 来 察看 utmp 中 与 你 的 登录 相关 的 两 条 记录 。 注 意 用 来 

登录 的 是 哪 一 个 终端 。 

3. 注销 其 中 一 

4. 运行 whol 察看 上 述 两 条 记录 内 容 的 变化 。 

你 会 发 现 其 中 一 条 的 用 户 名 字段 跟 原来 的 不 同 , 它 的 ut. time 字段 的 值 也 发 生 了 改变 ， 
在 有 些 系 统 中 ,用 户 名 是 被 清空 的 。 还 请 关心 该 记录 还 有 哪些 改变 ”如果 是 远程 登录 呢 ? 


2.9.2 注销 过 程 : 如 何 工作 的 
这 其 实 很 简单 ,要 把 用 户 名 清空 , 按 以 下 步骤 做 就 行 了 ， 
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打开 文件 utmp; 
从 utmp 中 找到 包含 你 所 在 终端 的 登录 记录 ; 
对 当前 记录 做 修改 ; 
关闭 文件 。 
下 面 详细 讨论 这 4 个 步骤 。 
1. 打开 文件 utmp 
因为 负责 注销 的 程序 必须 对 文件 utmp 进行 总 (找到 登录 记录 ) 和 号 (修改 登录 记录 ) 操 
作 , 所 以 必须 先 打 开 这 个 文件 : 


a 
Hm w Do E 


fd = open(UTMP FILE, O_RDWR); 


2. Ak utmp 中 找到 包含 你 所 在 终端 的 登录 记录 
这 一 步 很 简单 ,在 while 循环 中 读 取 一 条 utmp 记录 ,将 它 的 ut. line 字段 跟 你 的 终端 的 
名 字 做 比较 ,如 果 相 等 则 调用 修改 函数 ， 


while ( read(fd, rec, utmplen) == utmplen) /* get next record x/ 
if ( strcmp(rec.ut line, myline) == 0) /x what, my line? x/ 
revise entry(); /* remove my name x/ 


3. 对 当前 记录 做 修改 

负责 注销 的 程序 修改 当前 记录 ,再 把 它 写 回 到 文件 ump 中 。 上 有 具体 来 说 ,要 把 ut. type 
的 值 从 USER PROCESS 改 成 DEAD_PROCESS, 把 ut. time 字段 的 值 改 为 注销 时 间 , 也 就 
是 当前 时 间 , 有 些 版 本 会 把 用 户 名 和 远程 主机 字段 的 内 容 清 空 ,这 些 代 码 编 写 起 来 很 
容易 。 

接 下 来 要 处 理 一 个 棘手 的 问题 ,如 何 把 修改 过 的 记录 写 回 文件 ? 可 以 用 write 吗 ? 不 
行 , write 只 会 更 新 下 一 条 记录 ,而 不 是 当前 那 条 要 修改 的 记录 。 因 为 系统 每 次 打开 一 个 文件 
都 会 保存 一 个 指向 文件 当前 位 置 的 指针 , 当 读 写 操 作 完 成 时 ,指针 会 移 到 下 一 个 记录 位 置 ， 
这 个 指针 与 文件 描述 符 相 关联 。 在 这 种 情况 下 ,指针 是 指向 下 一 条 登录 记录 的 头 一 个 字 节 ， 
这 引出 了 一 个 重要 的 问题 : 

问题 : 在 文件 操作 中 ,如何 改变 一 个 文件 的 当前 读 / 写 位 置 ? 

答题 : 使 用 系统 调用 lseek。 

4. 关闭 文件 

调用 close(fd), 


2.9.3 改变 文件 的 当前 位 置 


前 面 讲 过 Unix 每 次 打开 一 个 文件 都 会 保存 一 个 指针 来 记录 文件 的 当前 位 置 ,如 图 2. 8 
Bram. 
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read 从 当前 位 置 读 入 指 
定 长 度 的 数据 ,然后 移动 
当前 位 置 指针 ,指向 下 一 
个 未 读 的 数据 






文件 开始 位 置 


文件 当前 位 置 
文件 结尾 


图 2.8 内 核 为 每 个 打开 的 文件 保存 一 个 位 置 指针 


当 从 文件 读数 据 时 ,内 核 从 指针 所 标明 的 地 方 开始 , 读 取 指 定 的 字 节 ,然后 移动 位 置 指 
针 , 指 向 下 一 个 未 被 读 取 的 字 节 , 写 文 件 的 操作 也 是 类 似 的 。 

指针 是 与 文件 描述 符 相 关联 的 ,而 不 是 与 文件 关联 ,所 以 如 果 两 个 程序 同时 打开 一 个 文 
件 ,这 时 会 有 两 个 指针 ,两 个 程序 对 文件 的 读 操作 不 会 互相 干扰 。 

系统 调用 lseek 可 以 改变 已 打开 文件 的 当前 位 置 ,1seek 的 用 法 如 下 : 





Iseek 

目标 使 指针 指向 文件 中 的 指定 位 置 
头 文 件 # include — sys/type. h> 

# include — unistd. h> 
函数 原型 _ off t oldpos = Iseek(int fd, off t dist, int base) 
参数 fd 文件 描述 符 

dist 移动 的 距离 

base SEEK SET => 文件 的 开始 


SEEK CUR 一 > 当前 位 置 
SEEK END => 文件 结尾 


返回 值 一 1 遇 到 错误 


oldpos ”指针 变化 前 的 位 置 
一 人 
Iseek 改变 文件 描述 符 所 关联 的 指针 的 位 置 ,新 的 位 置 由 dist 和 base 来 指定 ,base 是 基 
准 位 置 ,dist 是 从 基准 位 置 开始 的 偏 移 量 。 基准 位 置 可 以 是 文件 的 开始 (0) 、 当 前 位 置 CIO X 
文件 的 结尾 (2) 。 如 


lseek(fd, — (sizeof(struct utmp)), SEEK CUR); 


把 指针 往 前 移 一 个 utmp 结构 ,注意 偏 移 量 可 以 是 负 的 。 


lseek(fd, 10 * sizeof(struct utmp), SEEK SET); 


上 述 代码 把 指针 指 到 第 11 个 记录 的 开始 位 置 。 下 面 的 代码 ， 


lseek(fd, 0, SEEK END); 
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write(fd, "hello", strlen("hello")); 


使 指针 指 到 文件 的 末尾 , 接 下 来 写 一 个 字符 串 到 文件 中 。 
最 后 要 说 明 的 是 ,lseek(fd, 0，SEEK_CUR) 返 回 指 针 所 指向 的 当前 位 置 。 


2.9.4 编写 终端 注销 的 代码 
利用 上 述 知 识 就 可 以 编写 一 个 了 渔 数 对 注销 的 的 用 户 修改 utmp 中 相应 的 记录 : 


/* 
* logout tty(char x line) 
* marks a utmp record as logged out 
* does not blank username or remote host 
* return — 1 on error, 0 on success 
x*/ 
int logout tty(char * line) 
{ 


int fd; 

struct utmp rec; 

int len = sizeof(struct utmp); 

int retval = -1; /* pessimism */ 
if (( fd = open(UTMP FILE,O RDWR)) == -1) /* open file x/ 


return — 1; 


/* search and replace x/ 


while (read(fd, &rec, len) == len) 
if (strneomp(rec.ut line, line, sizeof(rec.ut line)) == 0) 
{ 
rec.ut_type = DEAD PROCESS; /* set type x/ 
if (time(&rec.ut time !- 一 1)) /* and time x/ 
if ( lseek(fd, — len, SEEK CUR)! -1) /x back up «/ 
if (write(fd, &rec, len) -- len) /* update x/ 
retval = 0; /* success! x/ 
break; 


j 
/* close the file x/ 
if (close(fd) == - 1) 
retval = -1; 
return retval; 


j 


上 述 这 段 代 码 对 每 个 系统 调用 都 有 出 错 处 理 , 这 是 很 有 必要 的 ,因为 这 个 程序 需要 修改 
一 些 重 要 的 系统 配置 文件 ,如 果 这 些 文件 的 内 容 遭 到 破坏 , 那 系统 就 会 遇 到 麻烦 。 实 际 上 ， 
这 本 书 中 不 是 所 有 的 地 方 都 有 很 完善 的 出 错 处 理 , 这 并 不 表示 出 错 处 理 不 重要 ,而 是 为 了 使 
程序 更 加 清晰 易 懂 ，。 
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接 下 来 看 一 看 出 错 处 理 与 报告 。 


2.10 ”处 理 系 统 调 用 中 的 错误 


如 果 open 无 法 打开 指定 的 文件 , 它 会 返回 一 1。 同 样 地 , 当 read 无 法 读 的 时 候 , 它 会 返 
回 一 1, 当 lseek 无 法 指定 指针 位 置 时 , 它 也 会 返回 一 1, 一 1 是 表示 在 系统 调用 中 出 了 些 问 题 ， 
调用 者 每 次 都 必须 检查 返回 值 , 一 旦 检测 到 错误 ,必须 做 出 相应 的 处 理 。 

系统 调用 会 遇 到 哪些 错误 呢 ?” 每 个 系统 调用 都 有 自己 的 错误 集 , 以 open 为 例 ,如 果 要 打 
开 的 文件 不 存在 ,或 者 虽然 存在 ,但 没有 读 的 权限 ,或 者 已 经 打开 的 文件 太 多 ,都 会 导致 系统 
报错 。 如 何 来 确定 发 生 了 哪 一 种 错误 呢 ? 

l. 确定 错误 的 种 类 : errno 

内 核 通 过 全 局 变量 errno 来 指明 错误 的 类 型 ,每 个 程序 都 可 以 访问 到 这 个 变量 。 

在 error(3) 的 联机 帮助 和 过 errno. h 之 中 包含 错误 代码 和 相应 的 说 明 ,以 下 是 一 些 例 子 ， 


i define 
it define 
# define 
# define 
# define 


EPERM 
ENOENT 
ESRCH 
EINTR 
EIO 


1 
2 
3 
4 
5 


/* Operation not permitted x/ 
/* No such file or directory */ 
/* No such process x/ 

/* Interrupted system call «/ 
/* I/O error x/ 


2. 不 同 的 错误 需要 不 同 的 处 理 
根据 以 上 列 出 的 错误 类 型 ,在 程序 中 进行 相应 的 处 理 : 


# include <errno. h> 


extern int errno; 


int sample() 


| 


int fd ; 


fd = open("file", O RDONLY); 


if (fd == 


{ 


- 1) 


printf("Cannot open file; "); 
if ( errno == ENOENT ) 


pritnf("There is no such file. "); 


else if ( errno == EINTR ) 


printf( "Interrupted while opening file."); 


else if ( errno == EACCESS ) 


printf("You do not have permission to open file."); 


需要 根据 不 同 的 错误 类 型 做 不 同 的 错误 处 理 。 如 果 要 打开 的 文件 不 存在 ,那么 给 出 提 
不 重新 输入 文件 名 ,如 果 已 经 打开 的 文件 太 多 , 那 就 关闭 一 些 不 需要 的 文件 ,这 种 情况 是 不 


需要 给 用 户 任何 提示 的 。 
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3. 显示 错误 信息 : perror(3) 

在 需要 显示 出 错误 信息 的 时 候 , 可 以 根据 不 同 的 错误 代码 打印 相应 的 字符 串 , 上 面 的 例 
T sample() 就 是 这 样 做 的 , 男 外 一 种 更 简便 的 方法 是 用 perror(string) 这 个 函数 , 它 会 自己 
查找 错误 代码 ,在 标准 错误 输出 中 显示 出 相应 的 错误 信息 ,参数 string 是 要 同时 显示 出 的 描 
述 性 信息 。 

应 用 了 perror 的 sample: 


int sample() 


{ 


int fd; 
fd = open("file", O RDONLY); 
if (fd == -1) 


{ 
perror("Cannot open file"); 


return; 


当 有 错误 发 生 时 ,可 能 会 看 到 如 下 的 信息 : 


Cannot open file; No such file or directory 


Cannot open file: Interrupted system call 


显示 的 第 一 部 分 是 用 户 传递 进去 的 描述 性 信息 ,第 二 部 分 是 根据 错误 代码 查 到 的 错误 
提示 。 


小 zh 


1 主要 内 容 
who 命令 通过 读 系 统 日 志 的 内 容 显 示 当 前 已 经 登录 的 用 户 。 
Unix 系统 把 数据 存放 在 文件 中 ,可 以 通过 以 下 系统 调用 操作 文件 : 


open(filename, how) 


creat(filename, mode) 
read(fd, buffer, amt) 
write(fd, buffer, amt) 
lseek(fd, distance, base) 
close(fd) 


进程 对 文件 的 读 / 写 都 要 通过 文件 描述 符 , 文 件 描述 符 表示 文件 和 进程 之 间 的 连接 。 
每 次 系统 调用 都 会 导致 用 户 模式 和 内 核 模式 的 切换 以 及 执行 内 核 代码 ,所 以 减少 程 
序 中 的 系统 调用 发 生 的 次 数 可 以 提高 程序 的 运行 效率 。 

”程序 可 以 通过 缓冲 技术 来 减少 系统 调用 的 次 数 , 仅 当 写 缓 冲 区 满 或 读 缓 冲 区 空 时 才 
调用 内 核 服 务 。 
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* Unix 内 核 可 以 通过 内 核 缓冲 来 减少 访问 磁盘 L/O 的 次 数 。 
Unix 中 时 间 的 处 理 方式 是 记录 从 某 一 个 时 间 开 始 经 过 的 秒 数 。 
。 当 系 统 调 用 出 错时 会 把 全 局 变量 errno 的 值 设 为 相应 的 错误 代码 ,然后 返回 一 1, 程 
序 可 以 通过 检查 errno 来 确定 错误 的 类 型 ,并 采取 相应 的 措施 。 
。 这 一 章 涉 及 的 知识 在 系统 中 都 可 以 找到 ,联机 帮助 中 有 命令 的 说 明 , 有 些 还 会 涉及 命 
令 的 实现 , 头 文件 中 有 结构 和 系统 常量 的 定义 ,还 有 函数 原型 的 说 明 。 
2. 习题 
2.1 在 Unix 中 有 一 个 w 命令 ,这 个 命令 与 who 有 关 ,运行 这 个 命令 ,并 阅读 它 的 联机 
帮助 , 找 出 它 提 供 了 哪些 who 没有 提供 的 信息 ? 其 中 有 哪些 信息 来 自 utmp 这 个 
文件 ?这 些 信息 各 是 什么 含义 ? 其 他 信息 来 自 哪 里 ? 


2.2 用 户 登 录 的 时 候 , 登 录 信息 会 被 记录 在 utmp 文件 中 ,在 注销 的 时 候 , 文 件 中 相应 
的 记录 会 被 删除 。 如 果 用 户 正在 使 用 系统 的 时 候 ,系统 突然 崩溃 ,很 明显 ,这 时 候 
utmp 文件 的 内 容 会 有 问题 ,在 系统 重新 启动 的 时 候 , 会 对 utmp 做 什么 处 理 呢 ? 
系统 会 不 会 重新 为 每 一 条 可 用 终端 建立 记录 ? 查阅 相关 的 联机 帮助 和 头 文件 ,以 
及 启动 脚本 ,来 找 出 上 述 问 题 的 答案 ,可 以 在 自己 的 机 器 上 做 实验 来 验证 自己 的 


2.3 ”做 个 实验 ,把 一 个 文件 复制 到 /dev/tty: cpl cpl. c /dev/tty。 这 时 复制 的 目标 文 
件 是 一 个 终端 。 对 终端 的 读 写 操作 与 对 一 个 普通 文件 进行 读 写 是 一 样 的 。 接 下 
来 做 实验 ,从 终端 读 , 这 时 会 从 键盘 读 字符 ,然后 写 人 到 文件 中 ,输入 是 以 回 车 十 
<Ctrl-D> 作 为 结束 标志 能 


2.4 标准 C 函数 如 fopen.getc.fclose. fgets 的 实现 都 包含 内 核 级 的 缓冲 ,它们 用 到 了 
一 个 结构 FILE, 并 以 此 为 基础 构造 了 类 似 utmplib 的 中 间 层 ,在 头 文件 中 找到 结 
构 FILE 的 成 员 描述 ,将 其 与 utmplib. c 中 的 变量 做 比较 。 


2.5 怎么 来 确定 数据 已 经 被 写 到 磁盘 上 (不 是 被 缓冲 )? 采用 缓冲 技术 时 ,内 核 会 把 要 
与 人 磁盘 的 数据 放 在 缓冲 区 ,然后 在 它 认 为 合适 的 时 候 写 人 磁盘 。 阅 读 相 应 的 联 
机 帮助 ,找到 能 够 确定 地 把 数据 写 人 磁盘 的 方法 。 


2.6 Unix 允许 一 个 文件 同时 被 多 个 进程 打开 ,也 允许 一 个 进程 同时 打开 好 几 个 文件 ， 
做 多 次 打开 文件 的 实验 .; 
(1) 以 读 的 方式 打开 文件 
(2) 以 写 的 方式 打开 文件 
(3) 骨 次 以 读 的 方式 打开 文件 
这 时 有 3 个 文件 描述 符 , 接 下 来 : 
(40. 从 第 一 个 文件 描述 符 ( 以 下 简称 fd) 中 读 20 字 节 ,显示 读 到 的 内 容 。 
(5) 从 第 二 个 fd S A"testing 123---”, 
(6) 从 第 三 个 fd 读 出 20 字 节 ,显示 读 到 的 内 容 。 
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2.7 联机 帮助 man 中 可 以 查 到 关于 命令 .系统 调用 、 系 统 设备 等 帮助 信息 ,如 何 才能 了 


2.8 


2.9 


解 man 的 使 用 方法 ? 在 你 的 系统 中 ,man 分 为 几 个 小 节 ? 它们 分 别 是 什么 ? 


本 章 提 到 文件 utmp 中 还 包含 了 一 些 记录 ,它们 与 已 登录 用 户 的 信息 无 关 , 那 么 它 
们 存放 的 是 什么 ? 各 代表 什么 含义 ? 


lseek 可 以 将 文件 指针 移动 文件 的 末尾 以 后 ,如 : 


lseek(fd, 100, SEEK END) 

将 指针 移 到 文件 末尾 再 往 后 100 个 字 节 的 地 方 。 如 果 从 文件 未 尾 以 后 100 个 字 节 
的 地 方 开始 读 会 出 现 什么 情况 ?如果 从 文件 末尾 以 后 100 个 字 节 的 地 方 开始 写 会 
出 现 什么 情况 ?从 100 字 节 增加 到 20000 字 节 ,再 写 人 “hello” 看 看 会 有 什么 结果 ， 
用 1s -1 来 检查 文件 的 长 度 , 再 用 1s -s 试 试 。 


3. 编程 练习 


2. 10 


2. 14 


2. 15 


从 who 的 联机 帮助 中 可 以 知道 who am i 也 是 可 以 接受 的 形式 ,同样 还 有 
whoami , 修改 who2. c, 使 它 支 持 who am i 的 形式 。 阅 读 whoami 的 联机 帮助 ,看 
它 与 who 有 什么 不 同 ,编程 实现 whoami。 


使 用 标准 cp 命令 时 , 当 原 文件 和 目标 文件 相同 时 ,会 有 什么 结果 ? 修改 who2. c 
使 之 能 够 处 理 这 种 情况 。 


在 utmplib. c 中 的 几 个 函数 是 为 了 提高 utmp 文件 的 读 写 效 率 ,调用 这 些 函 数 , 每 
次 返回 一 个 utmp 记录 ,有 时 返回 的 记录 中 可 能 不 包含 任何 有 用 的 信息 ,修改 
utmplib. c, 使 每 次 返回 的 都 是 有 用 的 信息 。 这 样 做 会 影响 到 who3. c 其 他 部 分 
的 代码 吗 ? 为 什么 ? 


PA SX logout_tty() 使 用 lseek 往 前 移动 指针 ,以 便 重 写 当前 记录 ,注意 在 这 个 函数 
中 没有 用 到 缓冲 技术 ,如 果 使 用 缓冲 可 以 提高 程序 的 运行 效率 。 
(1) 如 果 在 logout. tty O rH Sl] utmplib. e 中 的 函数 会 产生 什么 问题 ? 
(2) 在 utmplib. c 中 增加 一 个 函数 : 

utmp seek(record offset, base) 
改变 当前 指针 的 位 置 , record_offset 是 要 移动 的 偏 移 量 , base 可 以 是 SEEK _ 
SET、CEEK_CUR 或 SEEK_END, 注 意 偏 移 量 每 增加 1， 表示 要 移动 sizeof 
(struct utmp) 的 字 节 。 
(3) 修改 logout_tty() 以 便 能 够 使 用 utmplib. c 中 的 函数 ， 


whol 可 以 显示 出 utmp 中 的 每 条 记录 ,虽然 这 不 是 原来 想 要 的 功能 ,但 却 提供 了 
一 个 工具 ,以 便 能 够 检查 utmp 文件 内 容 的 变化 。utmp 记录 中 的 ut. type 字段 很 
有 用 ,修改 whol 使 之 能 够 显示 utmp 记录 的 所 有 字段 ,进一步 修改 使 whol 能 够 
通过 参数 指定 要 读 取 的 文件 ,这 样 就 可 以 用 whol 来 检查 文件 wtmp HAR., 


标准 的 cp 会 自动 覆盖 已 经 存在 的 文件 ,而 不 给 出 任何 提示 ,如 已 经 存在 了 一 个 文 
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ft. file2 ,又 输入 : 

S cp filel file2 
RM m file2 的 内 容 。 标 准 的 cp 有 一 个 参数 -i 可 以 在 覆盖 前 给 出 提示 ,得 到 确认 
A Bi. BK cpl.c 使 之 也 具有 上 述 特性 。 


4. 项 目 
根据 本 章 所 学 的 内 容 ,编写 以 下 的 Unix E 
ac, last, cat, head, tail, od, dd 

0. 最 后 一 个 问题 : tail 命令 

这 一 章 通过 分 析 几 个 命令 已 经 学 到 了 很 多 知识 ,最 后 还 有 一 个 命令 tail, 请 读者 来 分 析 。 

lseek 命令 可 以 移动 指针 ,lseek(fd, 0, SEEK_END) 可 以 使 指针 移 到 文件 的 未 尾 。 

tail 俞 令 显示 出 文件 末尾 指定 行 数 的 内 容 , 所 以 ,tail 必须 能 够 找到 文件 中 一 个 指定 的 地 
Fi ,注意 不 是 末尾 。 | 

这 如 何 来 实现 呢 ? 开动 脑筋 好 好 想 想 ,注意 用 缓冲 技术 来 提高 效率 。 阅 读 联机 帮助 看 
看 tail 都 有 哪些 选项 , 想 想 它们 怎么 实现 。 

本 书 的 网 站 上 有 两 个 版 本 的 tail 的 源 代码 ,其 中 一 个 是 GNU 版 本 的 ,另外 一 个 是 BSD 
版 本 的 ,它们 用 了 完全 不 同 的 思路 , 却 都 实现 得 很 好 ,最 好 先 自 CS ,然后 再 参考 它们 的 实现 。 
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概念 与 技巧 

。 目录 是 文件 的 列表 

。 如 何 读 取 目 录 的 内 容 

© 文件 类 型 以 及 如 何 知道 文件 的 类 型 
。 文件 属性 以 及 如 何 知道 文件 的 属性 
。 位 操作 及 掩 码 的 使 用 

。 用 户 与 组 ID 及 passwd 数据 库 
相关 系统 调用 与 函数 

* opendir,readdir,closedir,seekdir 
e stat 

e chmod,chown,utime 

* rename 

相关 命令 


e ls 


$1 六 2H 


已 经 介绍 了 如 何 读 / 写 文件 内 容 的 方法 。 除 了 内 容 之 外 ,文件 还 有 很 多 属性 ,比如 文件 
所 有 者 、 最 后 修改 时 间 ,文件 大 小 ,类 型 等 。 文 件 名 在 目录 中 列 出 ,正如 电话 号 码 短 中 列 有 人 
名 一 样 。 如 何 读 取 文 件 名 和 文件 的 属性 呢 ? 


ls 命令 可 以 列 出 目录 中 所 有 文件 的 名 字 , 以 及 这 些 文件 的 其 他 信息 。 本 章 通过 分 析 1s 
命令 来 学 习 目 录 和 文件 的 类 型 与 属性 。 


3.2. 问题 1: ls 命令 能 做 什么 


3.2.1 jls 可 以 列 出 文件 名 和 文件 的 属性 
在 命令 行 输入 ls: 
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$s ls 
Makefile docs  1s2.c s. tar statdemo.c  taill.c 
chap03 lsl.c old src  statl.c  taill 
$ 


ls 的 默认 动作 是 找 出 当前 目录 中 所 有 文件 的 文件 名 , 按 字典 序 排 序 后 输出 。 有 些 版 本 的 


ls 默认 会 分 栏 输出 ,有 些 需要 参数 -C 才 这 样 做 。 


Is 还 能 显示 其 他 的 信息 ,如 果 加 上 -1 选项 ,ls 会 列 出 每 个 文件 的 详细 信息 ,也 叫 ls 的 长 





$ 1s -1 

total 108 

~rw-rw-r-- 2 bruce users 345 Jul 29 11:05 Makefile 
-rw-rw-r-- 1 bruce users 27521 Aug 1 12:14 chap03 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:15 docs 
-rW-r--r-- 1 bruce users 723 Feb 9 1998 Isl.c 
-rw-r--r-- 1 bruce users 3045 Feb 15 03:51 1s2.c 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:14 old src 
-rw-rw-r-- 1 bruce users 30720 Aug 1 12:05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18 17.15 statl.c 
-rWw-r--r-- 1 bruce support 191 Feb 9 1998 statdemo.c 
-rwxrwxr-x 1 ‘bruce users 37351 Aug 1 12:13 taill 
-rw-r--r-- 1 bruce users 1416 Aug 1 12:05 taill.c 
$ 


每 一 行 代表 一 个 文件 和 它 的 多 个 属性 。 
.2 列 出 指定 目录 或 文件 的 信息 
一 个 Unix 系统 中 会 有 很 多 的 目录 ,每 个 目录 中 又 会 有 很 多 文件 。 如 果 要 列 出 一 个 


非 当 前 目录 的 内 容 或 者 是 一 个 特定 文件 的 信息 , 则 需要 在 参数 中 给 出 目录 名 或 文件 名 。 


用 ls 列 出 指定 目录 包含 的 文件 


例 子 说 AH 
ls /tmp 列 出 /tmp 目录 中 各 文件 的 文件 名 
ls - | docs 列 出 docs 目录 中 各 文件 的 属性 
ls —1../Makefile 显示 文件 .. /Makefile 的 属性 
ls *.c 显示 与 *.c 匹配 的 文件 


如 果 参 数 是 目录 ,ls 列 出 目录 的 内 容 , 如 果 参 数 是 文件 ,ls 列 出 文件 名 和 属性 。 所 给 的 命 


令 行 选项 在 很 大 程度 上 决定 了 ls 的 输出 内 容 。 
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3.2.3 经 常用 到 的 命令 行 选 项 


i $ 说 AA 

Is -a 列 出 的 内 容 包 含 以 “. ”开头 的 文件 
ls -lu 显示 最 后 访问 时 间 

ls =s 显示 以 块 为 单位 的 文件 大 小 

ls -t 输出 时 按时 间 排 序 

ls -F 显示 文件 类 型 


如 果 对 Unix 不 是 很 熟悉 ,那么 可 能 需要 解释 一 下 -a 这 个 选项 ,在 Unix 中 ,ls 一 般 不 会 
列 册 以 “开始 的 文件 ,所 以 可 以 把 这 样 的 文件 看 作 是 隐藏 文件 。ls 加 上 了 -a 以 后 , 遇 到 这 
样 的 文件 也 必须 把 它 列 出 来 。 对 操作 系统 (例如 内 核 ) 而 言 ,文件 名 前 面 的 “. ”没有 任何 特殊 
的 含义 , 它 只 对 Is 的 使 用 者 有 意义 。 

某 些 应 用 程序 的 配置 文件 是 位 于 用 户 的 主 目录 下 以 “. ”开始 的 某 个 文件 ,这 是 由 习惯 形 


成 的 ,因为 在 大 多 数 情况 下 可 以 将 它们 隐藏 。 但 是 需要 时 可 以 直接 被 打开 编辑 ,不 需要 任何 
特殊 的 操作 。 


3.2.4 问题 1 的 答案 


通过 实验 和 联机 帮助 可 以 知道 ls 做 了 以 下 两 件 事 : 

。 列 出 目录 的 内 容 

。 显示 文件 的 信息 

注意 ls 对 文件 和 目录 所 做 的 操作 是 不 同 的 。1s 能 判定 参数 指定 的 是 文件 还 是 目录 。 这 
是 如 何 做 到 的 呢 ? 如 果 要 自己 写 一 个 ls, 以 下 三 点 是 需要 掌握 的 : 

。 如 何 列 出 目录 的 内 容 

。 如 何 读 取 并 显示 文件 的 属性 

。 给 出 一 个 名 字 ,如 何 能 够 判断 出 它 是 目录 还 是 文件 


3.3 x dk Bi 


在 开始 之 前 , 先 来 看 看 Unix 是 如 何 组 织 磁盘 上 的 文件 的 。 
磁盘 上 的 文件 和 目录 被 组 成 一 棵 目录 树 ,每 个 节点 都 是 目录 或 文件 ,如 图 3. 1 HERR. 





EE 
A a 
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图 3. 1 中 的 大 方 框 表示 目录 ,大 方 框 内 的 小 方 框 表示 文件 ,目录 之 间 的 连 线 表示 目录 之 
间 的 组 织 关 系 。 

在 Unix 系统 中 ,每 个 文件 都 位 于 某 个 目录 中 ,在 逻辑 上 是 没有 驱动 器 或 卷 的 ,当然 在 物 
理 上 一 个 系统 可 以 有 多 个 驱动 器 或 分 区 ,每 个 驱动 器 上 都 可 以 有 分 区 ,位 于 不 同 驱动 器 和 分 
区 上 的 目录 通过 文件 树 无 缝 地 连接 在 一 起 ,甚至 软盘 .光盘 这 些 移动 存储 介质 也 被 挂 到 文件 
树 的 某 一 个 子 目 录 来 处 理 。 

这 些 使 ls 的 实现 极为 简单 ,只 需 考虑 文件 和 目录 两 种 情况 ,而 无 需 考 虑 驱动 器 或 分 区 。 


3.4 ”问题 2: Is 是 如 何 工作 的 


ls 产生 一 个 文件 名 的 列表 , 它 大 致 是 这 样 工作 的 ， 


open directory 
+—>read entry - end of dir? -+ 
| display file info | 


close directory < 一 一 一 一 一 一 一 一 一 一 + 


ER BBS who 的 十 分 相似 ,主要 的 区 别 是 who 从 文件 中 读数 据 , 而 ls 从 目录 中 读数 
据 , 读 目录 与 读 文 件 区 别 大 吗 ? 目录 到 底 是 什么 呢 ? 


3.4.1 什么 是 目录 


先 来 看 一 看 什么 是 目录 。 目 录 是 一 种 特殊 的 文件 , 它 的 内 容 是 文件 和 目录 的 名 字 。 从 
某 种 程度 上 说 ,目录 文件 与 上 一 章 讲 的 utmp 文件 很 类 似 。 它 们 都 包含 很 多 记录 ,每 个 记录 
的 格式 由 统一 的 标准 定义 。 每 条 记录 的 内 容 代表 一 个 文件 或 目录 

与 普通 文件 不 同 的 是 ,目录 文件 永远 不 会 空 ,每 个 目录 都 至 少 包含 两 个 特殊 的 项 一 
"ms oops ”表示 当前 目录 ,“. . ”表示 上 一 级 目录 。 


3.4.2 是 否 可 以 用 open.read 和 close 来 操作 目录 
通过 以 下 实验 来 看 目录 文件 的 内 容 : 


S cat / 
as'.a'asa..a'bw. tagsb'c( 
quota. userc'| 
quota.group'esbetce' 'sbtmp' "sbdev" sbmnt ' wcsbin '2 
sbopt2 
'8 
sbusr8 
19 
sbvar9 


(many lines of hard- to- read data omitted) 


$ more /tmp 
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/tmp is a directory 


$ od ~c /dev 
0000000 360 001 X0 X0 024 \o 001 NO . \O \O No 360 001 XO NO 
0000020 001 200 \O X0 002 WO WO \O 024 \O 002 WO . . \O NO 


0000040 002 \O NO NO 001 200 XO X0 361 001 XO NO 030 \O \a VO 
0000060 ^M A K E D E V \O 361 001 X0 \0 001 200 \o NO 
0000100 362 000 X0 X0 030 \0 004 NO k 1 o g \O NO NO NO 
0000120 362 001 X0 \0 001 200 X0 NO 363 001 X0 \0 030 X0 004 VO 
0000140 k c o n \O \O NO X0 363 001 NO XO 001 200 NO. VO 
0000160 364 001 \O \0 030 NO Na \O k b i n 1 o g NO 
0000200 364 001 X0 X0 001 200 X0 NO 365 001 X0 \0 030 \0 004 WO 
0000220 k m e m \O \O NO X0 365 001 XO \0 001 200 NO NO 
0000240 366 001 NO X0 024 \0 003 \O m e m \0 366001 WO NO 


从 以 上 的 例子 中 可 以 发 现 3 点 ,第 一 ,cat 和 od 可 以 打开 目录 。 因 为 cat 和 od 使 用 的 是 
标准 的 文件 操作 系统 调用 ,所 以 目录 可 以 被 open read,close 打开 ;第 二 ,more 可 以 区 分 出 文 
件 和 目录 , 它 拒 绝对 目录 进行 操作 ,有 些 版 本 的 cat 和 more 一 样 拒绝 显示 目录 内 容 ; 第 三 ,从 
以 上 列 出 的 目录 内 容 可 以 知道 ,目录 内 不 是 无 格式 的 文本 而 是 包含 一 定 的 数据 结构 。 

实际 上 用 open read.close 这 些 系统 调用 来 操作 目录 并 不 是 很 好 的 方法 ,Unix 支持 多 种 
的 目录 类 型 ,有 Apple HFS.ISO9660, VFAT NFS 等 ,如 果 用 read 来 读 , 那 么 需要 了 解 这 些 
不 同类 型 目录 各 自 的 结构 细节 。 


3.4.3 如何 读 目 录 的 内 容 
什么 晴 数 可 以 读 目 录 呢 ?” 在 联机 帮助 中 根据 关键 字 direct 来 查找 答案 : 


$ man - k direct 


我 所 用 的 系统 返回 了 81 条 主题 ,用 grep 滤 出 那些 包含 read HER. 


$ man ~ k direct | grep read 
DXmHelpSystemDisplay (3X) - Displays a topic or directory of the help file in Bookreader. 
opendir, readdir, readdir r, telldir, seekdir, rewinddir, closedir(3) - Performs operations 


on directories 


S * 
其 中 的 readdir 正 是 需要 的 ,来 看 它 的 联机 帮助 


$ man 3 readdir 


opendir(3) opendir(3) 
NAME 


opendir, readdir, readdir r, telldir, seekdir, rewinddir, closedir - 


Performs operations on directories 
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LIBRARY 


Standard C Library (libc.a) 
SYNOPSIS 


+ include — sys/types. h> 
+ include <dirent. h> 


DIR x opendir(const char * dir name); 

struct dirent * readdir(DIR x dir pointer); 

int readdir r(DIR x dir pointer, struct dirent x entry, 
struct dirent xx result); 

long telldir(DIR * dir pointer); 

void seekdir(DIR x dir pointer, long location ); 

void rewinddir(DIR * dir pointer); 

int closedir(DIR x dir pointer); 

[more] (115) 


通过 联机 帮助 可 以 知道 ,从 目录 读数 据 与 从 文件 读数 据 是 类 似 的 ,opendir 打开 一 个 目 
录 ,readdir 返回 目录 中 的 当前 项 ,closedir 关闭 一 个 目录 ， seekdir telldir, rewinddir 与 lseek 
的 功能 类 似 , 如 图 3.2 Bras. 


struct dirent 


opendir(char * ) 
creates a connection, 
returns a DIR * 


readdir (DIR * ) 
reads next records, 
returns a pointer 
to a struct dirent 


closedir (DIR * ) | 


closes a connection 





图 3.2 从 目录 中 读 到 一 项 


目录 忠文 件 的 列表 ,更 确切 地 说 ,是 记录 的 序列 ,每 条 记录 对 应 一 个 文件 或 子 目录 。 通 
过 readdir 来 读 取 目 录 中 的 记录 ,readdir 返回 一 个 指向 目录 的 当前 记录 的 指针 ,记录 的 类 型 
是 struct dirent, 这 个 结构 定义 在 /usr/include/dirent.h 中 ,联机 帮助 中 也 可 以 查 到 。 

在 SunOS 中 关于 它 的 帮助 信息 如 下 : 


File Formats dirent(4) 
NAME 


dirent — file system independent directory entry 
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SYNOPSIS 
# include <dirent. h> 


DESCRIPTION 
Different file system types may have different directory entries. The dirent structure 
defines a file system independent directory entry, which contains information common to 
directory entries in different file system types. A set of these structures is returned by 


the getdents(2) system call. 
The dirent structure is defined: 


struct dirent { | 
ino t d ino; 
off t d off; 
unsigned short d reclen; 
char d name( 1]; 
be 


dirent 结构 中 成 员 d_name 用 于 存放 文件 名 。 注 意 在 此 系统 中 d_name 被 定义 为 只 有 一 
个 元 素 的 数组 ,这 如 何 能 做 到 呢 ? 因为 一 个 字符 的 空间 只 能 存放 字符 串 的 结束 符 。 


3.5 [Alea 3: 如 何 编写 Is 


ls 的 算法 如 下 : 


main() 
opendir 
while ( readdir ) 
print d_name 


closedir 


TEIRA TF: 


/Xx lsi.c 
** purpose list contents of directory or directories 
** action if no args, use . else list files in args 
Xxx/ 

# include < stdio. h> 

# include < sys/types. h> 

# include <dirent. h> 


void do_ls(char | D; 


main(int ac, char x av[ ]) 





D PH: 关于 d_name 的 定义 ,UNIX 的 各 个 版 本 稍 有 不 同 ,在 Linux 中 是 char d name [NAME MAX- 1], 
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if (ac == 1) 
do ls( "." 5; 
else 


while ( —— ac ){ 
printf("%s:\n", x ++av); 
do ls( xav ); 


j 


void do ls( char dirname[] ) 


/* 
* list files in directory called dirname 
*/ 
( 
DIR x dir ptr; /* the directory x/ 


struct dirent x direntp; /x each entry x/ 


if ( ( dir ptr = opendir( dirname ) ) == NULL ) 
fprintf(stderr,"ls1; cannot open % s\n", dirname); 
else 
( 
while ( ( direntp = readdir( dir ptr ) ) ! = NULL) 
printf(" $% s\n", direntp —d name ); 
closedir(dir ptr); 


将 上 述 代码 编译 运行 ,并 将 输出 与 标准 的 1s 的 输出 做 比较 : 


$ cc ~olsl lsl.c 


$ ls1l 


s. tar 
taill 
Makefile 
lsl.c 
ls2.c 
chap03 
Old src 
docs 

lsl 
statl.c 


statdemo.c 
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taill.c 


5 ls 
Makefile docs lsl.c old src  statl.c taill 
chap03 lsi 1s2.c  s.tar Statdemo.c taill.c 


$ 


还 能 做 什么 


看 来 ls 的 第 一 个 版 本 还 不 错 , 但 是 以 下 功能 还 需要 加 进去 。 

(1) 排序 

ls] 的 输出 没有 经 过 排序 ,解决 办 法 : 把 所 有 的 文件 名 读 人 一 个 数组 ,用 qsort 函数 把 数 
组 排序 。 

(2) 分 栏 

标准 的 ls 的 输出 是 分 栏 排列 的 ,有 些 以 行 排序 输出 ,有 些 以 列 排序 输出 。 解 决 办 法 : 先 
把 文件 名 读 和 人 数组 ,然后 计算 出 列 的 宽度 和 行 数 。 

(3)“. ”文件 

Is] 列 出 了 “. "文件 ,而 标准 的 Is 只 有 在 给 出 -a 选项 时 才 会 列 出 这 些 文件 。 解 决 办 法 : 
使 lsl 能 够 接收 选项 -a HERA -a 的 时 候 不 显示 隐藏 文件 。 

(4) 选项 -] 

如 果 选 项 里 有 ~1, 标 准 的 ls 会 列 出 文件 的 详细 信息 ,而 lsl 不 会 。 解 决 办 法 : 要 解决 这 
个 问题 不 是 太 容 易 , 因 为 dirent 结构 中 没有 提供 所 需要 的 信息 ,如 文件 大 小 .文件 所 有 者 等 。 
如 果 文 件 的 这 些 信息 不 是 存储 在 目录 中 ,那么 它们 会 存储 在 什么 地 方 呢 ? 


3.6 编写 Is -l 


ls 要 做 两 件 事情 ,一 是 列 出 目录 的 内 容 , 二 是 显示 文件 的 详细 信息 ,这 实际 上 是 两 件 不 同 
的 工作 ,目录 包含 文件 名 ,文件 信息 则 需要 从 另外 的 途径 获得 , 接 下 来 从 3 个 问题 人 手 , 来 解 
决 文件 信息 显示 的 问题 。 


3.6.1 问题 1: ls -1 能 做 些 什 么 
先 来 看 ls 一 ] 的 输出 : 


$ ls -1 
total 108 
-YrW-rw-r-- 2 bruce users 345 Jul 29 11-05 Makefile 
-rw-rw-r-- 1 bruce Users 27521 Aug 1 12:14  chap03 
drwxrwxr-x 2 bruce Users 1024 Aug 1 .12:15 docs 
-rw-r--r-- 1 bruce Users 723 Feb 9 1998 I lsi.c 
-rw-r--r-- 1 bruce Users 3045 Feb 15 03:51 Ils2.c 

2 


drwxrwxr-x bruce Users 1024 Aug 1 12:14 old src 
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-rw-rw-r-- 1 bruce Users 30720 Aug 1 12:05 s.tar 

-rw-r--r-- 1 bruce support 946 Feb 18 17:15  statl.c 

-rw-r--r-- 1 bruce support 191 Feb 9 1998 statdemo.c 

-rwxrwxr-X 1 bruce Users 37351 Aug 1 12:13 taill 

-rw-r--r-- 1 bruce Users 1416 Aug 1 12:05 taill.c 

-rWw-r--r-- 1 cse215 cscie215 574 Feb 9 1998  writable.c 

$ 

每 行 都 包含 7 个 字段 。 

模式 (mode) 每 行 的 第 一 个 字符 表示 文件 类 型 。“- ”代表 普通 文件 ,“d” 代 表 目 
录 , 其 他 的 类 型 以 后 还 会 遇 到 。 
接 下 来 的 9 个 字符 表示 文件 访问 权限 ,分 为 读 权 限 、 写 权限 和 执行 
权限 ,又 分 别针 对 3 种 对 象 ; 用 户 、 同 组 用 户 和 其 他 用 户 , 所 以 一 共 
需要 9 位 来 表示 。 从 前 面 的 1s -1 的 输出 中 可 以 看 出 ,所 有 的 文件 
和 和 目录 对 所 有 用 户 都 是 可 读 的 ,只 有 文件 的 所 有 者 才能 对 文件 进 
行 修改 ,所 有 用 户 都 有 taill 的 执行 权限 。 

链接 数 (links) 链接 数 指 的 是 该 文件 被 引用 的 次 数 ,这 方面 的 内 容 将 在 下 一 章 
介绍 。 

文件 所 有 者 (owner) 指出 文件 所 有 者 的 用 户 名 。 

组 (group) 指 文件 所 有 者 所 在 的 组 。 有 些 版 本 的 1s 显示 组 名 。 

大 小 (size) 第 五 列 显示 文件 的 大 小 。 在 前 面 的 ls -1 的 输出 中 ,所 有 的 目录 大 
小 相等 ,都 是 1024 字 节 ,因为 目录 所 占 空间 的 分 配 是 以 块 (block) 
为 单位 的 ,每 个 块 512 字 节 ,所 以 目录 的 大 小 经 常 是 相等 的 。 如 果 
是 一 般 的 文件 ,size 列 则 显示 了 文件 中 数据 的 实际 字 节 数 。 

最 后 修改 时 间 文件 的 最 后 修改 时 间 。 如 果 是 较 新 的 文件 ,会 列 出 月 .日 和 时 刻 ， 

(last ~ modified) 对 于 较 老 的 文件 ,只 能 列 出 月 .日 和 年 。 

X ft ££ (name) 文件 名 


3.6.2 问题 2: ls -1 是 如 何 工作 的 
如 何 得 到 文件 的 信息 呢 ? 在 键盘 上 输入 ; 


$ man -k file | grep - 


i information 


在 有 些 系 统 上 可 以 得 到 有 用 的 参考 信息 ,有 些 却 不 可 以 。 因为 这 些 系 统 使 用 的 术语 是 
文件 状态 (file status) 而 不 是 文件 信息 (file information) 或 者 文件 属性 (file properties) 来 代 
表 文 件 的 各 种 信息 。 提 取 文 件 状态 的 系统 调用 是 stat, 


3.0.3 用 stat 得 到 文件 信息 
图 3. 3 显示 了 stat 的 工作 方式 。 
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stat(name, ptr) 


将 name 所 指定 的 文件 信 
息 读 入 一 个 结构 中 。 





图 3.3 用 stat 读 取 文 件 的 属性 


磁盘 上 的 文件 有 很 多 属性 ,如 文件 大 小 .文件 所 有 者 的 ID 等 。 如 果 需 要 得 到 文件 属性 ， 
进程 可 以 定义 一 个 结构 struct stat, RAIA stat ,告诉 内 核 把 文件 属性 存放 到 这 个 结构 中 。 





Stat 

目标 得 到 文件 的 属性 
头 文件 t include — sys/stat. h> 
函数 原型 int result — stat(char * fname, struct stat * bufp) 
参数 fname ”文件 名 

bufp 指向 buffer 的 指针 
返回 值 = 遇 到 错误 

0 成 功 返 回 





stat 把 文件 fname 的 信息 复制 到 指针 bufp 所 指 的 结构 中 。 下 面 的 代码 展示 了 如 何 用 
stat 来 得 到 文件 的 大 小 : 


/* filesize.c - prints size of passwd file x/ 


# include <_stdio. h> 
# include <sys/stat. h> 


int main() 

{ 
struct stat infobuf; /* place to store info x/ 
if ( stat( "/etc/passwd", &infobuf) == -1) /* get info x/ 


perror( "/etc/passwd") ; 
else 
printf(" The size of /etc/passwd is % d\n", 
infobuf.st size); 
} 


stat 把 文件 的 信息 复制 到 结构 infobuf 中 ,程序 从 成 员 变量 st. size 中 读 到 文件 大 小 。 
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3.6.4 stat 提供 的 其 他 信息 
stat 的 联机 帮助 和 头 文件 /usr/include/sysystat.h 描述 了 struct stat 的 成 员 变 量 


st_mode 文件 类 型 和 许可 权限 
st uid 用 户 所 有 者 的 ID 

st _ gid 所 属 组 的 ID 

st size 所 占 的 字 节 数 

st nlink 文件 链接 数 

st_mtime 文件 最 后 修改 时 间 
st_atime 文件 最 后 访问 时 间 

st ctime 文件 属性 最 后 改变 时 间 


stat 结构 中 其 他 未 被 ls -1 用 到 的 成 员 变量 未 在 这 里 列 出 。 下 面 的 例子 fileinfo. c 得 到 
以 上 这 些 属性 ,并 显示 出 来 。 


/x fileinfo.c - use stat() to obtain and print file properties 
x ~ some members are just numbers... 
x/ 

# include <stdio. h> 

+ include <sys/types. h> 

i include < sys/stat. h> 


int main(int ac, char x avj ]) 


{ 


struct stat info; /* buffer for file info x/ 
if (ac2»1) 
if ( stat(av[1], &info) {= -1 ){ 
Show stat info( av[1], &info); 
return 0; 
} 
else 
perror(av[1]); /* report stat() errors x/ 
return 1; 


} 


show stat info(char x fname, struct stat x buf) 


/* 
* displays some info from stat in a name - value format 
*/ 
( 
printf(" mode: % oin", buf —»st mode); /* type * mode x/ 
printf(" links; &dWn", buf —»st nlink); /* # links x/ 
printf(" user ; & din", buf —»st uid); /* user id */ | 


printf(" group: dn", buf —»st gid) ， /x group id «/ 
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printf(" size; d\n", buf —»st size); /x file size x/ 
printf(" modtime : & d\n", buf —»st mtime); /x modified x/ 
printf(" name; % s\n", fname ); /* filename */ 


} 


编译 并 运行 fileinfo ,并 把 它 跟 ls -1 作对 比 ; 


$ cc ~ o fileinfo fileinfo.c 
$ ./fileinfo fileinfo.c 
mode. 100664 
links; 1 
user: 500 
group; 120 
size: 1106 
modtime: 965158604 
name: fileinfo.c 
$ Is - L fileinfo.c 


—-rw-rw-r-- 1 bruce users 1106 Aug 1 15:36 fileinfo.c 


3.6.5 如 何 实现 


链接 数 (links) ,文件 大 小 Csize) 的 显示 都 没有 问题 ,最 后 修改 时 间 (modtime) 是 time t 类 
型 的 ,可 以 用 ctime 将 其 转化 成 字符 串 ,也 没 问题 。 
fileinfo 将 模式 (mode) 字 段 以 数字 形式 输出 ,然而 需要 的 是 如 下 的 形式 ， 


CIW IW-Y--— 


结构 中 的 用 户 所 有 者 (user) 和 组 Cgroup) 字 段 都 是 数值 ,而 显示 出 来 的 应 该 是 用 户 名 和 
组 名 ,为 了 完善 ls — 1, 必须 进一步 处 理 模 式 . 用 户 名 和 组 的 显示 。 


3.6.6 将 模式 字段 转换 成 字符 


文件 类 型 和 许可 权限 是 如 何 存储 在 st mode 中 ? 又 如 何 将 它们 转 成 10 个 字符 的 串 ? A 
进 制 的 100664 又 与 “rw-rw-r--” 有 什么 关系 呢 ? 对 这 3 个 问题 的 回答 就 构成 了 本 节 
的 内 容 。 

st mode 是 一 个 16 位 的 二 进 制 数 ,文件 类 型 和 权限 被 编码 在 这 个 数 中 ,如 图 3. 4 所 示 。 


type 2 user group other 
o 





图 3.4 文件 类 型 与 许可 权限 
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其 中 前 4 位 用 作文 件 类 型 ,最 多 可 以 标识 16 种 类 型 ,目前 已 经 使 用 了 其 中 的 7 个 。 

接 下 来 的 3 位 是 文件 的 特殊 属性 ,1 代表 具有 某 个 属性 ,0 代表 没有 ,这 3 位 分 别 是 set- 
user - ID 位 .set-group-ID 位 和 sticky 位 ,它们 的 含义 以 后 介绍 。 

最 后 的 9 位 是 许可 权限 ,分 为 3 组 ,对 应 3 种 用 户 ,它们 是 文件 所 有 者 、 同 组 用 户 和 其 他 
用 户 。 其 他 用 户 指 与 用 户 不 在 同一 个 组 的 人 。 每 组 3 位 ,分 别 是 读 、 写 和 执行 的 权限 。 相 应 
的 地 方 如 果 是 1, 就 说 明 该 用 户 拥 有 对 应 的 权限 ,0 代表 没有 。 





l. 字段 的 编码 
把 多 种 信息 编码 到 一 个 整数 的 不 同 字段 中 是 一 种 常用 的 技术 ,如 : 
编码 的 例子 
617 — 495 — 4204 电话 号 码 ( 区 号 - 局 号 -- 线 号 ) 
027 -93- 1111 社会 保障 号 
128. 103. 33. 100 IP 地 址 


2. 如 何 读 取 被 编码 的 值 

怎么 来 读 取 被 编码 的 值 呢 ? 比如 怎么 知道 212 - 222 ~ 4444 所 对 应 的 区 号 是 212? 很 简 
单 ,一 种 方法 是 将 号 码 的 前 3 位 同 212 比较 , 另 一 种 方法 是 将 暂时 不 需要 的 地 方 置 0, 这 里 把 
电话 号 码 的 后 7 位 置 0, 然 后 同 212 - 000 - 0000 比较 。 

为 了 比较 ,把 不 需要 的 地 方 置 0, 这 种 技术 称 为 掩 码 C(masking) ,就 如 同 带 上 面具 把 其 他 
部 位 都 谈 起 来 ,就 只 留 下 眼睛 在 外 面 。 这 里 用 一 系列 掩 码 来 把 st mode 的 值 转化 成 ls -1 要 
显示 的 字符 串 。 

子 域 编码 (subfield coding) 是 系统 编程 中 一 种 重要 且 常 用 的 技术 ,以 下 从 四 方面 详细 介 
绍 子 域 编码 与 掩 码 。 

(1) 掩 码 的 概念 

掩 码 会 将 不 需要 的 字段 置 0, 需 要 的 字段 的 值 不 发 生 改 变 ， 

(2) 整数 是 bit 组 成 的 序列 

整数 在 计算 机 中 是 以 bit 序列 的 形式 存在 的 ,图 3.5 显示 了 如 何以 二 进 制 的 0 和 1 8988 
来 表示 十 进 制 的 215。 想 一 下 00011010 表示 十 进 制 的 几 ? 


100’s 10's ]'s 
| 128 64 #32 16 8 4 2 1 
as fol 


128 64 32 16 8 4 2 |] 
m= fofofofofififofifo, 
图 3.5 在 整数 和 二 进 制 数 之 间 转 换 


(3) 掩 码 技 术 
5 0 fEfr 5j CE ) 操 作 可 以 将 相应 的 bit 置 为 0, 图 3.6 是 八进制 的 100664 通过 位 与 操作 
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把 一 些 bit 置 为 0。 注意 ,数字 中 的 某 些 1 是 如 何 被 置 为 0 的 。 





和 RE 


3.6 位 与 操作 


C4) 使 用 八进制 数 

直接 处 理 二 进 制 数 是 很 枯燥 乏味 的 。 如 同 处 理 一 长 串 十 进 制 数 时 人 们 常 将 它们 三 位 一 
AA St FF CHM 23,234,456,022) 一 样 , 一 种 简化 的 方法 是 将 二 进 制 数 每 三 位 分 为 一 组 来 操作 ,这 
就 是 八进制 数 (0 至 7)。 

如 可 以 把 二 进 制 的 1000000110110100 分 为 1,000,000,110,110,100, 从 而 得 到 八进制 
的 100664, 这 样 更 容易 理解 。 

3. 使 用 掩 码 来 解码 得 到 文件 类 型 

文件 类 型 在 模式 字段 的 第 一 个 字 节 的 前 四 位 ,可 以 通过 掩 码 来 将 其 他 的 部 分 置 0, 从 而 
得 到 类 型 的 值 。 

TE — sys/stat. h> PAL FEX. 


# define S IFMT 0170000 /* type of file x/ 

& define S IFREG 0100000 /* regular x/ 

$ define S IFDIR 0040000 /* directory x/ 

4 define S IFBLK 0060000 /* block special x/ 

d define S IFCHR 0020000 /* character special x/ 
# define S IFIFO 0010000 /* fifo x/ 

4 define S IFLNK 0120000 /* symbolic link */ 

4 define S IFSOCK 0140000 /* socket x/ 


S IFMT 是 一 个 掩 码 , 它 的 值 是 0170000, 可 以 用 来 过 滤 出 前 四 位 表示 的 文件 类 型 。S_ 
IFREG 代表 普通 文件 , 值 是 0100000,S_IFDIR 代表 目录 文件 , 值 是 0040000, 下 面 的 代码 : 


if ((info. st mode & 0170000) == 0040000 ) 


printf("this is a directory") ; 


通过 掩 码 把 其 他 无 关 的 部 分 置 0, 再 与 表示 目录 的 代码 比较 ,从 而 判断 这 是 否 是 一 个 
Ax. 
更 简单 的 方法 是 用 二 sys/stat. bh 二 中 的 宏 来 代替 上 述 代码 : 


/* 
* File type macros 
x/ 
# define S ISFIFO(m) (((m)&(0170000)) == (0010000)) 
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# define S ISDIR(m) (((m)&(0170000)) == (0040000)) 
4 define S_ISCHR(m)  (((m)&(0170000)) == (002000050) 
# define S ISBLK(m) ((€(m)&(0170000)) == (00600005) 
# define S ISREG(m) (((m)&(0170000)) == (01000000) 
使 用 宏 的 话 就 可 以 这 样 写 代码 : 


if (S ISDIR(info.st mode)? 


printf("this is a directory"); 


4. 解码 得 到 许可 权限 

模式 字段 的 最 低 9 位 是 许可 权限 , 它 标 识 了 文件 所 有 者 AP .其 他 用 户 的 读 、 写 .执行 
权限 。ls 将 这 些 位 转换 为 短 横 和 字母 的 串 。 在 <<sys/stat, h 盖 中 每 一 位 都 有 相应 的 掩 码 , 下 
面 的 代码 给 出 了 如 何 使 用 的 例子 : 


/* 
* This function takes a mode value and a char array 
x and puts into the char array the file type and the 
* nine letters that correspond to the bits in mode. 
* NOTE; It does not code setuid, setgid, and sticky 
* Codes 
*/ 

void mode to letters( int mode, char str[] ) 

( 


strepy( str, "---------- "); /* default = no perms x/ 
if ( S ISDIR(mode) ) str[0] = 'd'; /* directory? x/ 

if ( S ISCHR(mode) ) str[0] = 'c'; /* char devices x/ 

if ( S ISBLK(mode) ) str[0] = 'b'; /* block device x/ 

if ( mode & 5 IRUSR ) str[1] = 'r'; /* 3 bits for user x/ 


if ( mode & S IWUSR ) str[2] = 'w: 
if ( mode & S IXUSR ) str[3] = 'x' 


if ( mode & S IRGRP ) str[4] = 'r'; /* 3 bits for group x/ 
if ( mode & S. IWGRP ) str[5] = ‘wi 
if ( mode & S IXGRP ) str[6] = 'x'; 


if ( mode & S. IROTH ) str[7] = 'r'; /* 3 bits for other x/ 

if ( mode & S IWOTH ) str[8] = 'w: 

if ( mode & S IXOTH ) str[9] = 'x 
j 


5. 解码 并 编写 ds | 
到 此 为 止 , 已 经 可 以 正确 处 理 文件 大 小 、 链 接 数 .文件 名 模式 .最 后 修改 时 间 。 最 后 还 
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有 一 个 要 解决 的 问题 是 文件 所 有 者 (user) 和 组 (group) 的 表示 。 
3.6.7 将 用 户 / 组 ID 转换 成 字符 串 


在 struct stat 中 ,文件 所 有 者 和 组 是 以 ID 的 形式 存在 的 ,然而 1s 要 求 输出 用 户 名 和 组 
4 ,如何 根据 ID 找到 用 户 名 和 组 名 昵 ? 

可 以 试 着 在 联机 帮助 中 查找 关键 字 username, uid、group, 看 看 有 什么 结果 。 不 同 的 系 
统 中 得 到 的 结果 很 不 相同 。 下 面 是 一 些 说 明 ; 

(1) /etc/passwd 包含 用 户 列表 

回想 一 下 登录 过 程 ,输入 用 户 名 和 密码 ,经 过 验证 后 登录 成 功 ,出 现 提示 符 。 系 统 怎 么 
知道 用 户 名 和 密码 是 正确 的 ? 

这 就 涉及 到 /etc/ passwd 这 个 文件 , 它 包 含 了 系统 中 所 有 的 用 户 信息 ,下 面 是 一 个 例子 : 


root :WPA4d10wUxypE :0:0:root:/bin/bash 
bin: * :1:1:/bin:/bin: 
daemon: x :2:2:daemon:/sbin: 
smith;xlmEPcp4Tnokc:9768:3073:Jame Q Smith: /home/s/smith/ : 
/shells/tcsh 
fred:mSuVNOFACRTmE :20359 :550 : Fred : /home/f/ fred: /shells/tcsh 
diane:;70US8flPsrccY:20555:550:Diane Abramov: /home/d/diane: 
/ shells/tcsh 
ajr;WitmEBWylarlw:3607:3034;Ann Reuter :/home/a/ajr:/shells/bash 


这 是 个 纯 文本 文件 ,每 一 行 代表 一 个 用 户 , 用 冒号 “:” 分 成 不 同 的 字段 ,第 一 个 字段 是 用 
户 名 ,第 二 个 字段 是 密码 ,第 三 个 字段 是 用 户 ID, 第 四 个 字段 是 所 属 的 组 , 接 下 来 的 是 用 户 的 
全 名 、 主 目录 .用户 使 用 shell 程序 的 路 径 。 所 有 的 用 户 对 这 个 文件 都 有 读 权 限 , 关 于 这 个 文 
件 的 详细 信息 ,参见 联机 帮助 。 

似乎 使 用 这 个 文件 就 可 以 解决 用 户 ID 和 用 户 名 的 关联 问题 ,只 需 搜索 用 户 ID ,然后 就 
可 以 得 到 相应 的 用 户 名 。 然 而 在 实际 应 用 中 并 不 是 这 样 做 的 ,搜索 文件 是 一 件 很 繁琐 的 工 
VE ,而 且 对 于 很 多 网 络 计算 系 统 ,这 种 方法 是 不 起 作用 的 。 

(2) /etc/passwd 并 没有 包 插 所 有 的 用 户 

每 个 Unix 系统 都 有 /etc/passwd 这 个 文件 ,但 它 并 没有 包括 所 有 的 用 户 , 在 有 些 网 络 计 
算 系 统 中 ,用 户 要 能 够 登录 到 系统 中 的 任何 一 台 主 机 上 ,如 果 通 过 /etc/passwd 来 实现 ,就 必 
须 在 所 有 的 主机 上 维护 用 户 信 息 ,要 修改 密码 的 话 也 必须 修改 所 有 主机 上 的 密码 ,如 果 有 一 
台 主 机 刚好 宕 机 了 ,那么 在 宕 机 期 间 的 用 户 变化 情况 就 无 法 同步 到 这 台 主 机 上 、， 

较 好 的 解决 方法 是 在 一 台大 家 都 能 够 访问 到 的 主机 上 保存 所 有 用 户 信 息 , 它 被 称 做 
NIS, 所 有 的 主机 通过 NIS 来 进行 用 户 身份 验证 。 所 有 需要 用 户 信息 的 程序 也 从 NIS LK 
取 。 而 本 地 只 保存 所 有 用 户 的 一 个 子 集 以 备 离 线 操作 。 在 联机 帮助 中 有 NIS 的 详细 
信息 。 

(3) 通过 getpwuid 来 得 到 完整 的 用 户 列 表 

可 以 通过 库 盟 数 getpwuid 来 访问 用 户 信息 ,如 果 用 户 信息 保存 在 /etc/passwd 中 ,那么 
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getpwuid 会 查找 /etc/passwd 的 内 容 , 如 果 用 户 信息 在 NIS 中 ,getpwuid 会 从 NIS 中 获取 信 
县 ,所 以 用 getpwuid 使 程序 有 很 好 的 可 移植 性 。 

getpwuid 需要 UIDCuser ID) 作 为 参数 ,返回 一 个 指向 struct passwd 的 指针 ,这 个 结构 
定义 在 /usr/include/pwd.h 中 : 


/* The passwd structure x/ 


struct passwd { 


char * pw name; /* Username x/ 

char * pw passwd; /* Password x/ 

. uid t pw uid; /* User ID */ 

. gid t pw gid; /x Group ID x/ 

char * pw gecos; /x Real name «/ 

char x pw dir; /x Home directory */ 
char x pw shell; /* Shell Program x/ 


}; 
这 正 是 ls -1 的 输出 中 需要 的 ， 


/x 
* returns a username associated with the specified uid 
x NOTE: does not work if there is no username 
x/ 
char * uid to name(uid t uid) 
i 
return getpwuid(uid) —»pw name; 


} 


这 段 代码 很 简单 ,但 还 不 够 健壮 ,如 果 uid 不 是 一 个 合法 的 用 户 ID, 那 getpwuid 返回 空 
指针 NULL, 这 时 getpwuidCuid) — pw name 就 没有 意义 ,这 种 情况 会 发 生 吗 ? 常用 的 1s 
命令 有 一 种 处 理 这 种 情况 的 办 法 。 

(4) UID 没有 对 应 的 用 户 名 

假设 在 一 台 Unix 主机 上 有 一 个 账号 ,用 户 名 是 pat, 用 户 ID 是 2000, 创 建 了 一 个 文件 ， 
这 个 文件 的 st_uid 的 值 就 是 2000, 

假设 一 段 时 间 以 后 你 搬 走 了 ,系统 管理 员 于 是 把 这 个 账号 删除 ,在 passwd 中 不 再 有 pat 
这 一 行 , 这 时 如 果 getpwuid 得 到 的 参数 是 2000, 它 就 会 返回 NULL, 

标准 的 ls 如 果 遇 到 这 种 情况 ,会 打印 出 UID, 

当 新 加 入 一 个 用 户 时 ,新 用 户 有 可 能 与 一 个 已 被 删除 的 用 户 有 相同 的 UID, 这 时 , 老 用 
户 所 留 下 来 的 文件 会 被 用 户 所 拥有 ,新 用 户 对 这 些 文件 具有 所 有 的 权限 。 

最 后 一 个 问题 是 组 ID 如 何 处 理 ? 什么 是 组 ”什么 是 组 ID? 

(5) /etc/group 是 组 的 列表 

对 一 台 公 司 里 的 主机 而 言 ,可 能 要 将 用 户 分 为 不 同 的 组 ,如 销售 人 员 一 组 ,行政 人 员 一 
组 等 。 要 是 在 学 校 里 ,可 能 有 教师 组 和 学 生 组 。Unix 提供 了 进行 组 管理 的 手段 ,文件 








第 3 章 目录 与 文件 属性 : 编写 ls . 8l 。 


/etc/group 是 一 个 保存 所 有 的 组 信息 的 文本 文件 : 


root: :0 .root 

other::1: 
bin::2:root,bin,daemon 
SyS::3:root,bin,sys,adm 
adm; ;4:root ,adm, daemon 
uucp; :5 :root ,uucp 
mail::6-root 
tty::7:root,tty,adm 
lp::8:root,lp,adm 


第 一 个 字段 是 组 名 ,第 二 个 是 组 密码 ,这 个 字段 极 少 用 到 ,第 三 个 是 组 IDCGIDO ,第 四 个 
是 组 中 的 成 员 列 表 。 

(6) 用 户 可 以 同时 属于 多 个 组 

passwd 文件 中 有 每 个 用 户 所 属 的 组 ,实际 上 那里 列 出 的 是 用 户 的 主 组 (primary group), 
用 户 还 可 以 是 其 他 组 的 成 员 , 要 将 用 户 添加 到 组 中 ,只 要 把 它 的 用 户 名 添加 到 /etc/group 中 
这 个 组 所 在 行 的 最 后 一 个 字段 即 可 。 在 刚才 的 例子 中 ,用 户 adm 同时 属于 sys. adm, tty, lp 
等 多 个 组 。 这 个 列表 在 处 理 组 访问 权限 时 会 被 用 到 。 例 如 一 个 文件 属于 lp 组 , 且 组 成 员 有 
这 个 文件 的 写 权限 ,所 以 用 户 adm 就 可 以 修改 这 个 文件 。 

(7) 通过 getgrgid 来 访问 组 列表 

在 网 络 计算 系统 中 ,组 信息 也 被 保存 在 NIS H. Unix 系统 提供 getgrgid 函数 屏 藏 掉 实 
现 的 差异 。 用 这 个 函数 ,用 户 可 以 得 到 组 名 而 不 用 操心 实现 的 细节 。getgrgid 的 用 户 手 册 对 
这 个 函数 及 相关 函数 做 了 详细 解释 。 在 1s -1 中 ,可 以 这 样 得 到 组 名 


/* 

* returns a groupname associated with the specified gid 
* NOTE: does not work if there is no groupname 

*/ 
char * gid to name(gid t gid) 

{ 

return getgrgid(gid) —»gr name; 
} 


3.6.8 编写 ls2.c 


对 ls -1 的 每 一 项 输出 ,都 有 办 法 将 它们 转换 为 用 户 可 理解 的 格式 。 把 它们 综合 起 来 ， 
就 得 到 了 以 下 代码 : 


/* ls2.c 
* purpose list contents of directory or directories 
* action if no args, use . else list files in args 


* note uses stat and pwd. h and grp. h 
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x BUG: try 1s2 /tmp 

x/ 

ii include <(stdio. h > 

i include <sys/ types. h> 
# include <dirent. h> 

d include < sys/stat. h> 


void do ls(char[ D; 

void dostat(char *); 

void show file info( char * , struct stat *); 
void mode to letters( int , char [| 5; 

char x uid to name( uid t ); 


char * gid to name( gid t); 


main(int ac, char x av[]) 


{ 


if (ac == 1) 
do ls( "."); 
else 


while ( -~ac ){ 
printf("$ s;An", x *ttav); 


do ls( * av); 


void do ls( char dirname[ ]) 
/* 
* list files in directory called dirname 
x / 
{ 
DIR x dir ptr; /* the directory x/ 


struct dirent x direntp; /* each entry x/ 


if ( ( dir ptr = opendir( dirname ) ) == NULL ) 
fprintf(stderr,"l1s1; cannot open % s\n", dirname); 


else 


{ 
while ( ( direntp = readdir( dir ptr ) ) 1 = NULL ) 


dostat( direntp —>d_name ); 
closedir(dir ptr); 


j 


void dostat( char x filename ) 


| 


Struct stat info; 
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if ( stat(filename, &info) == -1) /x cannot stat */ 
perror( filename ); /* say why */ 
else /* else show info x/ 


show file info( filename, &info ); 


void show file info( char x filename, struct stat * info p) 
/* 
x display the info about filename. The info is stored in struct at x info p 
x*/ 
{ 
char  *uid to name(), *ctime(), x gid to name(), * filemode(); 
void mode to letters(); 


char modestr| 11]; 


mode to letters( info p->st mode, modestr ); 


printf( "% s" , modestr ); 


, 
printf( "& 4d " , (int) info p—st nlink); 

printf( "% —8s " , uid to name(info p-—»st uid) ); 
printf( "€ -8s " , gid to name(info p->st gid) ); 
printf( "*81d " , (long)info p——st size); 

printf( "% .12s ", 4 t ctime(&info p —»st mtime)); 


printf( "$ s\n" , filename ); 


/* 


* utility functions 


x/ 
/* 


* This function takes a mode value and a char array 
* and puts into the char array the file type and the 
* nine letters that correspond to the bits in mode. 
* NOTE: It does not code setuid, setgid, and sticky 
* codes 
x/ 

void mode to letters( int mode, char str[ ] ) 

{ 


strcpy( str, "-~-------- "); /x default = no perms x/ 
if ( S_ISDIR(mode) ) str[0] = 'd'; /* directory? x/ 

if ( S ISCHR(Omode) ) str[(0] = 'c'; /* char devices x/ 

if (S ISBLK(mode) ) str[0] = 'b'; /* block device x/ 

if ( mode & S IRUSR ) str[1] = 'r'; /* 3 bits for user x/ 
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if ( mode & S IWUSR ) str[2] = 'w'; 
if ( mode & S IXUSR ) str[3] = 'x'; 
if ( mode & S IRGRP ) str[4] = 'r'; /* 3 bits for group «/ 


if ( mode & S IWGRP ) str[5] = 'w'; 


if ( mode & S IXGRP ) str[6] = 'x'; 
if ( mode & S IROTH ) str[7] = 'r'; /* 3 bits for other x/ 
if ( mode & S INOTH ) str[8] = 'w'; 
if ( mode & S IXOTH ) str[9] - "X. 


# include « pwd. h> 


char * uid to name( uid t uid ) 
/* 
* returns pointer to username associated with uid, uses getpw() 
*/ 
( 
struct passwd x getpwuid(), x pw ptr; 
static char numstr[10]; 


if ( ( pw _ ptr = getpwuid( uid) ) == NULL ){ 
sprintf(numstr," % d", uid); 
return numstr; 

j 

else 


return pw ptr —-pw name ; 


r 


# include «grp. h> 


char * gid to name( gid t gid ) 
/* 
* returns pointer to group number gid. used getgrgid(3) 
*/ 
( 
struct group * getgrgid(), x grp ptr; 
static char numstr[10]; 


if ( ( grp ptr = getgrgid(gid) ) == NULL ){ 
sprintf(numstr," % d", gid); 
return numstr; 


j 


else 


return grp ptr —gr name; 
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将 1s2 的 输出 与 标准 的 ls 对 比 : 


$ 1s2 

drwxrwxr-x - 4 bruce bruce 1024 Aug 2 18:18 
drwxrwxr-x 5 bruce bruce 1024 Aug 2 18;14 
-rw-rw-r-- 1 bruce users 30720 Aug 1 12:05 s.tar 
-rwxrwxr-x 1 bruce users 37351 Aug 1 12-13 taill 
-rw-rw-r-- 2 bruce users 345 Jul 29 11:05 Makefile 
-rw-r--r-- 1 bruce users 723 Aug 1 14:26 Isl.c 
-rw-r--r-- 1 bruce users 3045 Feb 15 03:51  1s2.c 
-rw-rw-r-- 1 bruce users 27521 Aug 1 12:14 Jchap03 
drwxrwxr-x 2 bruce users 1024 Aug ] 12;14 old src 
drwxrwXr-x 2 bruce users 1024 Aug 1 12:15 docs 
—rWXIWXr-X 1 bruce bruce 37048 Aug 1 14:26 Ist 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15  statl.c 
-rWXrWwXr-X 2 bruce bruce 42295 Aug 2 18:18 1s2 
-rw-r--r-- 1 bruce support 191 Feb 9 21:01  statdemo.c 
-rw-r--r-- 1 bruce users 1416 Aug 1 12:05 taill.c 
$ ls -1 

total 189 

-rw-rw-r-- 2 bruce users 345 Jul 29 11:05 Makefile 
-rw-rw-r-- ] bruce users 27521 Aug 1 12:14  chap03 
drwxrwxr-x 2 bruce users 1024 Aug 1 12:15 docs 
-IrWXIWXrI-X 2 bruce bruce 42295 Aug 2 18:18 1s2 
-rw-r-.-r-- 1 bruce users 723 Bug 1 14:26 lsl.c 
-IWXIWXI-X 1 bruce bruce 37048 Aug 1 14:26 1sl 
-rw-r--r-- 1 bruce users 3045 Feb 15 03:51 £I1s2.c 
drwxrwxr-x 2 bruce users 1024 Aug’ 1 12:14 old src 
-rwW-rw-r-- 1 bruce users 30720 Aug 1 12;05 s.tar 
-rw-r--r-- 1 bruce support 946 Feb 18 17:15  statl.c 
-rw-r--r-- 1 bruce support 191 Feb 9 1998  statdemo.c 
-rWXIWXI-X 1 bruce users 37351 Aug 1 12:13 taili 
-rw-r--r-- 1 bruce users 1416 Aug 1 12;05 taili.c 
9 


ls2 的 输出 看 起 来 已 经 很 不 错 了 ,模式 字段 .用户 名 和 组 名 的 处 理 已 经 完成 。 但 还 有 些 工 
作 要 做 。 标 准 的 1s 会 显示 记录 总 数 ,1s2 不 会 ,而 且 1s2 还 没 将 结果 按 文件 名 排序 ,也 不 支持 
选项 -a。 它 还 假设 参数 是 目录 名 。 

152 还 有 一 个 致命 的 问题 ,不 能 显示 指定 目录 的 信息 ,你 可 以 试 一 试 ,在 命令 行 输 入 : 
ls2 /tmp。 可 以 在 本 章 结 尾 的 练习 中 修正 这 些 问题 。 
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3.7 三 个 特殊 的 位 


结构 stat 中 的 st. mode 成 员 包 含 16 位 ,其 中 4 位 用 作文 件 类 型 ,9 位 用 作 许 可 权限 , 番 
PRY 3 位 用 作文 件 特殊 属性 。 


3.7.1  set- user - ID 位 


在 这 3 位 中 ,第 一 位 叫做 set- user- ID 位 , 它 的 出 现 是 为 了 解决 一 个 重要 的 问题 , 即 用 
户 如 何 更 改 自己 的 密码 ? 

看 起 来 好 像 很 容易 ,用 passwd 命令 就 可 以 。 

接 下 来 研究 一 下 passwd 的 工作 原理 , 先 来 看 /etc/passwd 这 个 文件 ,注意 这 个 文件 的 所 
有 者 和 文件 访问 权限 设置 : 


5 ls -1 /etc/passwd 
-rW-r--r-- 1 root root 894 Jun 20 19:17  /etc/passwd 


更 改 密码 会 导致 上 述 文件 内 容 的 变化 ,但 是 普通 用 户 没有 修改 这 个 文件 的 权限 ,只 有 
root 用 户 才 可 以 修改 它 ,passwd 命令 怎么 能 够 修改 这 个 文件 呢 ? 

解决 的 办 法 ,不 是 给 所 有 用 户 修改 这 个 文件 的 权限 ,而 是 给 passwd 命令 一 个 特殊 的 权限 ， 
使 passwd 命令 的 文件 所 有 者 是 root, 而 且 它 的 特殊 属性 中 包含 set -user -ID 位 ,如 下 : 


$ ls - 1 /usr/bin/passwd 
—r-sr-xr-x 1 root bin 15725 Oct 31 1997 /usr/bin/passwd 


SUID 位 告诉 内 核 ,运行 这 个 程序 的 时 候 认 为 是 由 文件 所 有 者 在 运行 这 个 程序 ,在 这 里 
就 是 root, 而 root 有 修改 /etc/passwd 的 权限 。 | 

l. 是 否 可 以 更 改 其 他 用 户 的 密码 ? 

答案 是 否定 的 ,passwd 命令 知道 是 谁 在 运行 程序 。 它 用 系统 调用 getuid 来 得 到 用 户 ID, 
passwd 命令 是 可 以 修改 /etc/passwd 这 个 文件 ,但 它 只 会 修改 该 用 户 ID 所 对 应 的 密码 。 

2. set- user - ID 的 其 他 用 处 

SUID 位 经 常用 来 给 某 些 程 序 提供 额外 的 权限 ,比如 系统 中 的 打印 队列 。 有 可 能 同时 有 
很 多 用 户 发 出 打印 请 求 , 但 系统 只 有 一 台 打印 机 ,这 时 要 把 打印 请 求 都 放 到 打印 队列 中 去 ， 
命令 lpr 负责 把 用 户 要 打印 的 文件 复制 到 一 个 特定 的 系统 目录 中 去 。 如 果 这 个 目录 所 有 用 
户 都 有 访问 权限 , 那 将 会 产生 一 些 不 安全 因素 ,恶意 用 户 有 删除 别人 的 打印 作业 的 可 能 。 设 
置 lpr BY SUID 位 就 可 以 解决 这 个 问题 ,使 lpr 的 文件 所 有 者 是 root 和 lpr。 当 一 个 普通 用 户 
调用 lpr 时 ,lpr 就 以 root 或 lpr 的 权限 运行 ,可 以 对 这 个 系统 目录 进行 操作 ,而 普通 用 户 却 
不 能 直接 对 这 个 目录 进行 控制 。 执 行 从 打印 队列 移 除 操作 的 程序 也 是 设置 SUID 的 。 

一 些 游戏 会 把 成 绩 最 好 的 用 户 的 信息 写 入 数据 库 或 记录 文件 ,可 以 把 这 些 执行 写 动作 
的 程序 的 文件 所 有 者 设 为 数据 库 或 记录 文件 的 所 有 者 ,再 设 上 set- user- ID 位 ,这 样 普通 用 
户 都 可 以 玩 游戏 ,但 只 有 游戏 程序 才 可 以 修改 成 绩 。 
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3. 检验 SUID 4z HBB 
可 以 通过 二 sys/stat.h 放 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 SUID fy: 


# define S ISUID 0004000 /* set user ID on execution x/ 


将 它 转换 为 二 进 制 ,将 会 看 到 它 正 好 是 3 个 特殊 位 的 第 一 位 ， 
3.7.2 set-group- ID 位 


第 二 个 特殊 属性 位 是 用 来 设置 程序 运行 时 所 属 组 的 ,如 果 一 个 程序 所 属 的 组 设 为 g, 而 
HEK set- group - ID 位 也 被 设置 ,那么 程序 运行 的 时 候 就 好 像 它 正 被 g 组 中 的 某 一 个 用 户 
Zrt. set- group - ID 位 给 程序 某 一 个 组 的 访问 权限 。 

可 以 通过 二 sys/stat. hb 二 中 定义 的 掩 码 来 检验 某 一 个 程序 是 否 有 set-group-ID fiz: 


# define S ISGID 0002000 / xset group ID on executionx/ 


3.7.3 sticky 位 


sticky 位 对 于 文件 和 目录 有 不 同 的 用 途 。 对 于 文件 而 言 , 早 期 的 Unix 系统 经 常 要 在 有 
限 的 内 存 中 同时 运行 很 多 程序 , 它 使 用 到 交换 (swap) 技 术 。 例 如 系统 中 内 存 只 有 1MB OR 
余 空间 ,但 系统 要 同时 运行 3 个 程序 ,每 个 需要 0. SMB 的 内 存 , 很 明显 MARI 
程序 待 在 内 存 中 。 在 某 个 时 候 如 果 某 个 程序 没 运行 ,内 核 会 把 它 临 时 地 存放 到 硬盘 上 一 
叫 交换 空间 的 分 区 中 , 空 出 来 的 内 存 可 以 给 其 他 程序 使 用 ， 当 在 交 的 空间 中 的 程序 将 要 再 次 
运行 时 ,内 核 会 把 它 装载 到 内 存 中 。 

从 交换 空间 装载 程序 要 比 从 普通 的 硬盘 空间 快 ,在 非 交 换 空间 的 硬盘 上 ,程序 可 能 被 分 
成 好 几 块 分 别 存放 在 多 个 地 方 ,交换 空间 上 的 文件 是 不 分 块 的 。 

一 些 经 常用 到 的 程序 ,如 编辑 器 .编译 器 和 游戏 ,如 果 位 于 交换 空间 上 ,那么 装载 的 速度 
就 会 快 得 多 。sticky 位 告诉 内 核 即 使 没有 人 在 使 用 程序 ,也 要 把 它 放 在 交换 空间 中 。 程 序 粘 
在 交换 空间 中 ,就 好 像 口 香 糖 粘 在 鞋子 上 一 样 。 0 

现在 ,交换 技术 已 经 不 像 以 前 那么 重要 了 ,取而代之 的 是 虚拟 内 存 技术 ,虚拟 内 存 使 得 
可 以 以 更 小 的 单位 ,如 页 (page) ,进行 交换 。 

对 于 目录 而 言 sticky 的 含义 是 不 同 的 。 有 些 自 录 被 设计 用 来 存放 临时 文件 ,如 /tmp, 谁 
都 可 以 往 这 里 创建 /删除 文件 ,sticky 位 使 得 目录 里 的 文件 只 能 被 创建 者 删除 。 


3.7.4 用 ls-1 看 到 的 特殊 属性 


正如 刚才 所 看 到 的 ,每 个 文件 有 12 位 的 文件 属性 ,但 ls 只 用 9 个 字符 来 表示 , 它 是 如 何 
来 表示 的 呢 ? 
来 看 下 面 的 例子 : 


-rwsr-sr-t 1 root root 2345 Jun 12  14;02 sample 
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在 许可 权限 部 分 ,用 户 的 x 被 替换 成 s, 代 表 set-user-ID 被 设置 ,组 用 户 的 x 被 替换 s, 
代表 set- group - ID 被 设置 ,其 他 用 户 的 x 被 替换 成 t, 代 表 sticky 被 设置 ,更 详细 的 信息 参 
见 联机 帮助 。 


3.8 Is 小 结 


本 章 编写 的 ls 程序 可 以 列 出 目录 里 的 文件 ,还 可 以 列 出 文件 的 详细 信息 。 在 分 析 和 实 
现 的 过 程 中 ,应 该 可 以 学 到 Unix 很 多 方面 的 知识 。 

(D 文件 与 目录 

Unix 将 数据 存放 于 文件 中 ,目录 是 特殊 的 文件 , 它 的 内 容 就 是 其 中 的 文件 和 子 目 录 的 名 
字 , 还 包含 目 己 的 名 字 ,Unix 提供 一 系列 函数 对 目录 操作 ,打开 , 读 、 定 位 .关闭 等 ,但 不 提供 
写 目 录 的 函数 。 

(2) APSA 

系统 中 的 每 个 用 户 都 有 用 户 名 和 用 户 ID, 人 们 可 以 用 用 户 名 登录 到 系统 。 系 统 通 过 
UID 来 区 分 不 同 用 户 的 文件 。 每 个 用 户 都 属于 至 少 一 个 组 。 每 个 组 都 有 组 名 和 组 ID, 

(3) 文件 属性 

每 个 文件 都 有 很 多 属性 ,程序 通过 系统 调用 stat 来 得 到 文件 的 属性 。 

(4) 文件 的 所 有 关系 

每 个 文件 都 有 文件 所 有 者 ,文件 所 有 者 的 ID 是 文件 属性 的 一 部 分 。 同 样 的 每 个 文件 都 
属于 某 个 组 ,组 ID 也 是 文件 属性 的 一 部 分 。 

(5) 许可 权限 | 

文件 的 许可 权限 规定 了 哪 种 用 户 可 以 进行 哪些 操作 ,有 3 种 用 户 : 文件 所 有 者 、 同 组 用 
户 和 其 他 用 户 ,3 种 操作 : 读 、 写 和 执行 。 


3.9 设置 和 修改 文件 的 属性 


文件 有 很 多 属性 ,ls ~1 可 以 列 出 来 ,这 些 属性 是 如 何 建立 的 ? 是 否 可 以 改变 文件 的 属 
性 ? 如 果 可 以 ,如 何 改 ? 如 果 不 可 以 ,为 什么 ? 这 是 接 下 来 要 介绍 的 问题 ， 


-rW-r--r-- 1 bruce users 3045 Feb 15 03:51  1s2.c 
从 左 到 右 来 看 文件 ls2. c 的 属性 。 
3.9.1 文件 类 型 


文件 的 类 型 有 普通 文件 ,目录 文件 .设备 文件 、socket 文件 .符号 链接 文件 、 命 名 管道 
(named pipe) X fF A, 

(OD 文件 类 型 的 建立 

文件 类 型 是 在 创建 文件 的 时 候 建 立 的 ,如 用 系统 调用 creat 建立 一 个 普通 文件 。 其 他 类 
型 的 文件 如 目录 ,设备 等 ,可 使 用 不 同 的 函数 创建 。 
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(2) 修改 文件 类 型 
文件 一 经 创建 ,类 型 就 无 法 修改 ,虽然 在 童话 里 ,南瓜 可 以 变 成 马车 ,但 这 里 的 文件 类 型 
是 不 能 变 的 。 | 


3.9.2 许可 位 与 特殊 属性 位 


每 个 文件 都 有 9 位 的 许可 权限 和 3 位 的 特殊 属性 ,它们 是 在 文件 创建 的 时 候 建立 的 , 创 
建 以 后 ,它们 可 以 被 chmod 系统 调用 修改 。 

(1) 建立 文件 的 模式 | 

creat 的 第 二 个 参数 指定 了 要 创建 文件 的 许可 位 ,如 : 


fd = creat( "newfile", 0744 ); 


指定 新 创建 文件 的 许可 位 为 rwxr-r--。 

这 个 参数 只 是 请 求 , 而 不 是 命令 。 内 核 会 通过 “新 建文 件 掩 码 ”(file- creation - mask) 
来 得 到 文件 的 最 终 模式 。“ 新 建文 件 掉 码 ”是 一 个 很 有 用 的 系统 变量 , 它 指定 哪些 位 需要 
被 天 掉 。 例 如 要 防止 程序 创建 能 被 同 组 用 户 和 其 他 用 户 修 改 的 文件 ,那么 可 以 通过 关 掉 
----w--w- 来 实现 。 这 可 以 通过 把 “新 建文 件 掩 码 ?的 值 设 为 八进制 数 022 来 实现 。 
例如 : 


umask( 022 ); 


这 里 的 umask 是 一 个 系统 命令 ,可 以 改变 变量 umask 的 的 值 。 
(2) 改变 文件 的 模式 
程序 可 以 通过 系统 调用 chmod 来 改变 文件 的 模式 ,如 ， 


chmod( "/tmp/myfile", 04764) ; 
chmod( "/tmp/myfile",S ISUID|S IRWXU| S IRGRP|S IWGRP|S IROTH ); 


上 述 两 条 指令 的 作用 相同 ,第 一 条 是 八进制 来 表示 ,第 二 条 是 用 二 sys/stat. h> HEY 
的 符号 来 表示 。 后 者 有 明显 的 优点 , 当 系 统 定 义 的 许可 位 的 值 改变 时 ,无 需 修改 程序 。 系 统 - 
调用 chmod 不 受 “ 新 建文 件 掩 码 ” 的 影响 。 





chmod 

目标 修改 文件 的 许可 权限 和 特殊 属性 
头 文 件 # include « sys/types, h>> 

t include «sys/stat, h> 
EE LE int result = chmod(char * path, mode t mode) ; 
参数 path 文件 名 

mode 新 的 许可 权限 和 特殊 记性 
返回 值 一 | 过 到 错误 


0 成 功 返 回 | 
eee 
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C3) 用 来 修改 文件 的 许可 权限 和 特殊 属性 的 命令 
Shell 命令 chmod 也 可 以 用 来 完成 上 述 操 作 。 它 可 以 通过 两 种 模式 指定 权限 和 属性 , 八 
进 制 模式 (如 04764) 和 符号 模式 (如 u=rws g=rw or. 


3.9.3 文件 的 链接 数 


关于 链接 数 的 详细 讨论 在 下 一 章 。 简 而 言 之 ,链接 数 就 是 文件 被 引用 的 次 数 ( 别 名 的 数 
量 )。 如 果 一 个 文件 在 目录 树 中 一 共有 3 个 别名 ,那么 这 个 文件 的 链接 数 就 是 3。 增 加 文件 
的 别名 (使 用 link) 会 使 链接 数 增加 ,减少 别名 (使 用 unlink) 会 使 链接 数 减 少 。 


3.9.4 文件 所 有 者 与 组 


每 个 文件 都 有 文件 所 有 者 ,Unix 通过 用 户 ID 和 组 ID 来 标识 文件 所 有 者 和 文件 所 属 

的 组 。 

(1) 文件 所 有 者 

简单 的 说 ,文件 所 有 者 就 是 创建 文件 的 用 户 , 用 户 通 过 creat 建立 文件 时 ,内 核 把 文件 所 
有 者 设 为 运行 程序 的 用 户 ,如 果 程 序 具有 set- user - ID 位 ,那么 新 文件 的 文件 所 有 者 就 是 程 
序 的 文件 所 有 者 。 

(2) 组 

通常 情况 下 ,新 文件 的 组 被 设 为 执行 创建 动作 的 用 户 所 在 的 组 ,在 有 些 情况 下 ,组 会 被 
设 为 与 父 目 录 的 组 相同 。 这 听 起 来 好 像 婴 儿 的 国籍 由 出 生地 决定 而 不 由 父母 的 国籍 来 决定 。 

(3) 修改 文件 所 有 者 和 组 

通过 系统 调用 chown 来 修改 文件 所 有 者 和 组 : 


chown( "filel", 200, 40); 


将 文件 filel 的 用 户 ID git? 200,28 ID 改 为 40, 如 果 后 两 个 参数 的 值 都 是 一 1， 那么 文件 
所 有 者 和 组 都 不 会 改变 。 一 般 用 户 不 大 会 修改 文件 的 文件 所 有 者 和 组 ,但 root 经 常 出 于 管 
理 上 的 目的 要 修改 这 些 内 容 。 文 件 所 有 者 可 以 把 文件 的 组 改 成 任何 一 个 他 所 属 的 组 。 





chown 


目标 修改 文件 所 有 者 和 组 

头 文件 # include «unistd. h> 

EMILE: int chown(char * path, uid t owner, gid t group) 
参数 path 文件 名 


owner 新 的 文件 所 有 者 ID 
group ”新 的 组 ID 
返回 值 一 1 B Bik 


0 成 功 返 回 
一 


(4) 用 来 修改 文件 所 有 者 和 组 的 命令 
Shell 命令 chown 和 chgrp 可 以 用 来 修改 文件 所 有 者 和 组 ,它们 可 以 一 次 修改 多 个 文件 ， 
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可 以 用 用 户 名 /组 名 作为 参数 ,也 可 以 用 用 户 ID/ 组 ID 作为 参数 ,关于 它们 的 详细 使 用 说 明 
参见 联机 帮助 。 


3.9.5 文件 大 小 


文件 .目录 和 命名 管道 的 大 小 是 它们 实际 所 占用 的 存储 空间 的 字 节 数 目 ， 当 向 文件 汪 
加 内 容 时 ,文件 的 大 小 会 自动 增加 ,可 以 使 用 系统 调用 creat 把 文件 的 大 小 置 为 0。 不 存在 能 
够 直接 减 小 文件 占用 的 空间 的 函数 ， 


3.9.6 有 时间 


每 个 文件 都 有 3 个 时 间 : 最 后 修改 (modification) 时 间 、 最 后 访问 (access) 时 间 和 属性 
(如 用 户 所 有 者 IPD,、 许 可 权限 ) 最 后 修改 时 间 , 当 文件 被 操作 时 ,内 核 会 自动 地 修改 这 些 时 间 ， 
也 可 以 编程 来 修改 最 后 修改 时 间 和 最 后 访问 时 间 。 

(1) 修改 最 后 修改 时 间 和 最 后 访问 时 间 

utime 系统 调用 可 以 用 来 设置 最 后 修改 时 间 和 最 后 访问 时 间 , 使 用 一 个 包含 两 个 time, t 
结构 的 变量 ,一 个 time t 用 来 存放 更 新 的 最 后 修改 时 间 , 另 一 个 是 最 后 访问 时 间 。 





utime 

目标 修改 文件 最 后 修改 时 间 和 最 后 访问 时 间 
it include < sys/time. h> 

头 文件 + include <utime. h> 
# include < sys/types. h>> 

oy ay ea Fd | int utime(char * path, struct utimbuf * newtimes) 
path 文件 名 

参数 newtimes ”指向 结构 变量 utimbuf 的 指针 

| TÉ Jl, utime. h 
一 遇 到 错误 
EB 0 成 功 返 回 





什么 时 候 需 要 修改 这 些 时 间 呢 ? 举 个 例子 ,在 文件 备份 的 时 候 ,文件 的 最 后 修改 时 间 和 
访问 时 间 会 被 记录 下 来 , 当 文 件 被 恢复 的 时 候 , 希 望 文件 的 这 些 时 间 与 原来 的 相同 ,这 时 候 
就 可 以 用 utime。 人 恢复 时 做 了 两 件 事 , 一 是 把 备份 的 文件 复制 回去 ,二 是 把 最 后 修改 时 间 和 
访问 时 间 改 成 备份 时 候 的 情况 ,这样 被 恢复 的 文件 就 与 备份 时 的 完全 一 样 。 

(2) 用 命令 修改 最 后 修改 时 间 和 最 后 访问 时 间 

shell 命令 touch 可 以 修改 文件 的 最 后 访问 时 间 和 最 后 修改 时 间 ,详细 的 信息 参见 联机 
帮助 。 


3.9.7 文件 名 


创建 文件 时 会 指定 一 个 文件 名 ,命令 mv 可 以 改变 一 个 文件 的 名 字 , 也 可 以 把 文件 从 一 
个 地 方 移动 到 另 一 个 地 方 。 

OD 文件 名 的 建立 

系统 调用 creat 在 指定 文件 模式 的 同时 会 指定 文件 的 和 名字。 
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(2) 修改 文件 名 
系统 调用 rename 可 以 修改 文件 /目录 的 名 字 , 还 可 以 移动 文件 的 位 置 , 它 有 两 个 参数 ， 
原文 件 名 和 新 文件 名 。 


rename 





目标 修改 文件 名 或 移动 文件 的 位 置 
头 文件 # include < stdio. h> 
函数 原型 int result = rename( char * old, char * new ) 
参数 old 原来 的 文件 名 或 目录 各 

new 新 的 文件 名 或 目录 名 
返回 值 —1 遇 到 错误 

0 成 功 返 回 

小 结 
1. 主要 内 容 


磁盘 上 有 文件 和 目录 ,文件 和 目录 都 有 内 容 和 属性 。 文 件 的 内 容 可 以 是 任意 的 数据 ， 
目录 的 内 容 只 能 是 文件 名 / 子 目录 名 的 列表 。 
目录 中 的 文件 名 / 子 目 录 名 指 问 文件 和 其 他 的 目录 ,内 核 提 供 了 系统 调用 来 读 取 目 录 
的 内 容 . 读 取 和 修改 文件 的 属性 . 
。 文件 类 型 文件 的 访问 权限 和 特殊 属性 被 编码 存储 在 一 个 16 位 整数 中 ,可 以 通过 掩 
码 技术 来 读 取 这 些 信息 。 
。 文件 所 有 者 和 组 信息 是 以 ID 的 形式 保存 的 ,它们 与 用 户 名 和 组 名 的 联系 保存 在 
passwd 和 group 数据 库 中 。 
2. 进一步 的 问题 
从 本 章 可 以 知道 目录 的 内 容 是 文件 名 和 目录 名 的 列表 ,目录 被 互相 连接 组 成 一 棵 树 , 它 
们 是 如 何 连 在 一 起 的 ? 下 一 章 会 对 目录 的 结构 做 详细 的 介绍 。 
3. 图 示 
RE dE. AR 文件 及 它们 的 属性 如 图 3. 7 Bron. 
4. 习题 
3.1 Æ struct dirent 中 ,数组 d_name 1 的 长 度 在 有 的 系统 上 是 1, 而 在 有 的 系统 上 是 
255 ,实际 的 长 度 是 多 少 ? 为 什么 会 有 这 些 不 同 ? 为 什么 不 定义 成 char * ? 


3.2 文件 保护 模式 ------ rwx 可 以 通过 命令 chmod 007 filename 得 到 ,虽然 这 种 做 法 
很 奇怪 ,但 却 是 合法 的 ,其 他 用 户 对 文件 有 全 部 权限 ,组 用 户 和 文件 所 有 者 都 没有 
给 任何 权限 。 对 于 这 样 的 文件 , 谁 可 以 读 ? 当 内 核 执行 open 时 ,采用 的 是 什么 逻 
辑 来 判断 是 否 可 以 执行 ? 通过 实验 来 验证 自己 的 想法 ,如 果 可 以 看 到 内 核 的 代 
码 , 阅 读 相 关 代 码 。 


3. 3 


3.4 


3. 5 


3. 6 


3. 7 
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stat ( ) 





目录 普通 文件 
图 3.7 磁盘 上 有 目录 、 文 件 及 它们 的 属性 


每 个 用 户 都 有 用 户 名 ,每 个 用 户 名 都 有 对 应 的 用 户 ID, 是 否 可 能 两 个 不 同 的 用 户 
名 对 应 一 个 相同 的 ID? 是 否 人 允许 同一 个 用 户 拥有 两 个 不 同 的 ID? 如 果 有 root 权 
限 ,可 以 试 一 试 ,创建 两 个 用 户 , 改 成 同一 个 ID, 但 有 不 同 的 用 户 名 和 密码 。 这 两 
个 用 户 是 否 可 以 修改 对 方 的 文件 ? who 输出 什么 ?1s - 工 输出 什么 ?命令 id 输出 
什么 ? 相互 发 送 e-mail 呢 ? 从 中 能 够 看 出 些 什 么 ? 多 个 用 户 使 用 同一 个 ID 还 有 
什么 其 他 用 途 ? 


与 普通 的 文件 一 样 ， 目录 也 有 特殊 属性 位 ,其 中 包含 set- user - ID 和 set - group - 
ID 位 ,使 set- user ID 有 效 对 目 录 有 什么 影响 ?如 果 有 ,那么 是 什么 ? 为 什么 ? 
如 果 没 有 影响 ,那么 你 能 想象 出 这 些 位 有 什么 作用 吗 ? 


每 个 文件 的 执行 权限 都 可 以 被 打开 或 关闭 ,假设 一 个 纯 文本 文件 具有 执行 权限 ， 
它 是 否 可 以 被 执行 ? 如 有 果 一 个 包含 可 执行 代码 的 文件 ,如 对 C 语言 编译 后 的 可 执 
行文 件 a. out, 没 有 执行 权限 的 话 , 它 是 否 可 以 被 执行 ? 讨论 执行 权限 和 可 执行 代 
人 码 之 间 的 区 别 。 它 们 之 间 有 关系 吗 ? 参见 命令 file 的 联机 帮助 。 


每 个 用 户 都 有 用 户 名 和 用 户 ID, 这 可 以 被 认为 是 两 种 标识 系统 ,为 什么 要 这 样 ? 
能 不 能 直接 用 用 户 名 来 表示 文件 所 有 者 ? 为 什么 ? 能 不 能 只 用 其 中 一 种 标识 系 
统 ? 两 套 表示 系统 有 什么 优 缺 点 ? 如 果 由 你 来 设计 系统 ,你 会 如 何 设 计 ? 


命令 dirent 的 联机 帮助 中 提 到 了 系统 调用 getdents(2), 它 的 功能 是 什么 ? 与 
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readdir 有 什么 关系 ? 


命令 ls-1 的 输出 中 有 这 样 一 项 drwxr-xr-x, 表 示 这 是 一 个 目录 , 它 的 文件 所 有 者 
有 全 部 权限 ,组 用 户 和 其 他 用 户 只 有 读 和 执行 的 权限 。 对 于 文件 而 言 ,执行 权限 
意味 着 计算 机 可 以 执行 其 中 包含 的 机 器 代码 或 脚本 语句 ,对 于 目录 而 言 , 执 行 权 
限 有 什么 意义 ? 可 以 用 chmod 来 关 掉 这 个 目录 的 执行 权限 ,看 看 会 发 生 什 么 。 


用 户 是 通过 终端 或 终端 模拟 程序 登录 到 系统 中 的 ,终端 设备 文件 位 于 /dev 目录 
下 ,输入 ls-1 /dev/tty * | more, 显 示 出 所 有 的 终端 设备 文件 的 详细 信息 ,与 普通 
文件 一 样 ,终端 设备 文件 也 有 文件 所 有 者 ,就 是 在 这 个 终端 登录 的 用 户 , 无 用 户 使 
用 的 终端 设备 的 文件 所 有 者 是 root. 

ZX m V a OC TE HU OC TE PTS €x login 程序 所 改变 ,查看 login 的 源 代 人 码 , 找 到 改变 
文件 所 有 者 的 部 分 。 当 用 户 注 销 时 ,终端 设备 的 文件 所 有 者 会 被 改 回 成 root, 是 
哪 一 个 程序 改变 文件 所 有 者 的 ? 


5. 编程 练习 


3.10 


为 了 将 分 栏 输出 的 功能 加 入 到 Isl. c 中 ,观察 标准 的 ls 的 输出 ,发 现 每 一 栏 的 宽 
度 是 由 这 一 栏 最 长 的 文件 名 决定 的 ,而 且 显 示 的 栏 数 还 受 终端 显示 器 的 宽度 影 
啊 , 每 一 列 尽 可 能 的 等 宽 。 这 是 如 何 实 现 的 ? 


前 面 提 到 182. c 无 法 处 理 在 命令 行 给 出 目录 作为 参数 (ls2 /tmp) ,修改 182. c 使 之 
能 够 处 理 。 


修改 1s2. c, 使 之 能 够 正确 显示 文件 特殊 属性 suid, sgid 和 sticky, 参 见 联机 帮助 
确保 程序 能 处 理 各 种 情况 。 


使 用 标准 的 cp 时 ,如 果 第 二 个 参数 是 目录 ,那么 会 把 第 一 个 参数 指定 的 文件 复制 
到 相应 的 目录 下 ,如 : 

S cp filel /tmp 
等 价 于 : 

S cp filel /tmp/filel 


修改 第 2 章 的 cpl. c 使 之 能 够 完成 上 述 工作 。 


有 时 需要 对 整个 目录 作 备份 ,修改 cpl. c 使 得 当 两 个 参数 都 是 目录 时 ,把 第 一 个 
目录 中 的 所 有 文件 复制 到 第 二 个 目录 中 ,文件 名 不 变 。 


修改 1s1.c 使 得 它 能 够 将 文件 排序 后 输出 。 标 准 的 ls 支持 选项 -r, 它 的 作用 是 
逆序 输出 ,把 这 项 功能 也 加 入 到 Is]. c 中 。 有 些 版 本 的 ls 支持 选项 -q, 它 的 作用 
是 不 排序 输出 , 当 目录 中 的 文件 特别 多 的 时 候 , 可 以 加 快 ls 的 输出 速度 


有 一 个 目录 , 它 的 许可 权限 为 rwxr-x--x, 写 出 对 应 的 st mode 的 二 进 制 
形式 。 
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当 关 掉 一 个 文件 的 读 权限 ,就 不 能 打开 这 个 文件 来 读 。 如 果 从 一 个 终端 登录 , 打 
开 一 个 文件 ,保持 文件 的 打开 状态 ,然后 从 另外 的 终端 登录 ,去 掉 文件 的 读 权 限 ， 
这 时 有 什么 事情 会 发 生 ? 编写 一 个 程序 , 先 用 open() 打 开 一 个 文件 ,用 read O i£ 
一 些 内 容 , 调 用 sleep(20) 等 待 20s 以 后 ,再 读 一 些 内 容 , 从 另外 的 终端 ,在 等 待 的 
20 s 内 去 掉 文 件 的 读 权 限 ,这 样 会 有 什么 结果 ? 


标准 的 Is 支持 选项 -R, 它 的 功能 是 递归 地 列 出 目录 中 所 有 的 文件 包含 子 目 录 中 
的 文件 。 修 改 152. c, 使 之 支持 这 一 功能 。 


标准 的 1s 支持 选项 -u, 它 会 显示 出 文件 的 最 后 访问 时 间 , 如 果 用 了 -nu 而 不 用 - 
1, 会 有 什么 结果 ? 修改 ls2. c 使 之 支持 这 一 功能 。 提 示 : 读 -选项 的 内 容 。 


自己 编写 一 个 chown, ,使 之 能 够 接收 用 户 名 或 用 户 ID 作为 参数 ,能够 一 次 修改 多 
个 文件 的 文件 所 有 者 。 考 虑 以 下 问题 ,如 何 将 文件 名 转换 为 用 户 ID? 如 果 用 户 
名 不 存在 怎么 办 ? 提示: 要 测试 这 个 程序 ,可 能 需要 管理 员 的 权限 。 


在 做 文件 恢复 的 时 候 ,不 仅 希 望 将 文件 恢复 ,还 希望 将 文件 的 最 后 修改 时 间 和 最 
后 访问 时 间 恢 复 , 编 写 cp 来 实现 上 述 要 求 。 


可 以 通过 终端 设备 文件 来 与 用 户 收 发 数据 ,如 程序 从 这 个 文件 读数 据 , 就 等 于 从 
FAP HY) BE Fe ise BY , 瑟 数 据 就 等 于 将 数据 显示 在 屏幕 上 。 struct stat 中 的 成 员 变 
量 st mtime 记录 了 文件 最 后 修改 时 间 , 编 写 程序 lastdata 列 出 每 个 用 户 的 中 断 
设备 文件 的 最 后 修改 时 间 ,输出 格式 参照 who。 


6. 项 目 
根据 本 章 所 学 的 内 容 , 可 以 编写 以 下 的 Unix 程序 ， 


chmod,file,chown,chgrp.finger,touch 
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概念 与 技巧 

© Unix 树 状 文件 系统 的 概念 

。 Unix 文件 系统 的 内 部 结构 : i- 节 点 和 数据 块 
。 目录 的 连接 方式 

。 硬 链 接 和 符号 链接 的 概念 及 相应 的 系统 调用 
。 pwd 的 工作 原理 

。 文件 系统 的 装载 (mounting) 

相关 系统 调用 

e mkdir,rmdir,chdir 

e link,unlink,rename,symlink 

相关 命令 

* pwd 


4.1 T 2H 


文件 包含 数据 ,而 目录 是 文件 的 列表 。 不 同 的 目录 互相 连接 构成 树 状 的 结构 。 目 录 还 
可 以 包含 其 他 的 目录 。 文 件 “ 在 一 个 目录 中 ”是 什么 意思 呢 ? 当 登录 到 一 台 Unix 的 机 器 上 ， 
可 以 说 你 处 在 “你 的 主 目 录 中 ” ,一 个 人 “处 在 某 个 是 录 中 "又 是 什么 意思 呢 ? 

树 状 结构 像 是 一 个 神话 。 一 个 硬盘 实际 上 是 由 一 些 金属 圆 盘 构成 的 ,每 个 盘面 上 都 有 
磁性 物质 。 这 些 金属 盘 如 何 显示 为 一 个 包含 文件 .属性 和 目录 的 树 状 结构 呢 ? 

为 回答 这 些 间 题 需要 编写 自己 的 pwd 命令 。pwd 显示 你 在 目录 树 中 的 当前 位 置 。 从 树 
根 到 你 所 处 位 置 所 经 过 的 目录 的 序列 被 称 做 路 径 (path) 。 要 编写 pwd, 必须 了 解 文件 和 目录 
是 如 何 组 织 和 存储 的 。 本 章 将 先 察 看 文件 系统 的 外 在 特征 , 接 下 来 分 析 它 的 内 部 结构 ,最 后 
和 学习 相应 的 系统 调用 的 功能 和 使 用 方法 。 
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4.2 从 用 户 的 角度 看 文件 系统 


4.2.1 目录 和 文件 


从 用 户 的 角度 来 看 , Unix 系统 中 硬盘 上 的 文件 组 成 一 棵 目录 树 。 每 个 目录 能 包含 文件 
或 其 他 的 目录 。 图 4. 1 是 树 的 一 个 示例 。 

下 面 将 从 构建 这 个 目录 结构 开始 ,介绍 管 
理 这 些 文件 和 目录 树 的 Unix 命令 。 


4.2.2 目录 命令 


可 以 按照 下 面 的 命令 顺序 建立 如 图 4. 1 
所 示 的 这 棵 树 : 


demodir 





$ mkdir demodir 

$ cd demodir 

$ pwd 

/ home/ yourname/experiments/demodir 
S mkdir b cops 

$ mvbc 

$ rmdir cops 

$ cdc 

$ mkdir d1 d2 

$ cd ../.. 

$ mkdir demodir/a 


其 实 要 达到 同样 的 效果 ,本 可 以 使 用 若干 其 他 的 命令 ,这 里 为 了 演示 而 故意 做 得 复杂 些 。 

按照 上 面 的 例子 建立 这 棵 树 。 例 子 中 使 用 了 一 些 基 本 的 命令 ,mkdir 用 来 创建 一 个 指定 
的 目录 或 多 个 目录 。 思 考 以 下 问题 ,创建 一 个 和 已 有 文件 或 目录 同名 的 目录 将 会 怎样 ? 
rmdir 用 来 删除 一 个 有 目录 或 多 个 目录 ,删除 一 个 包含 子 目 录 的 目录 会 发 生 什 么 事 呢 ? mv 用 
来 重 命名 一 个 目录 ,也 可 用 来 将 一 个 目录 从 一 个 地 方 移 到 另 一 个 地 方 。 

与 上 述 命令 不 同 的 是 cd 命令 不 对 目录 产生 影响 , 它 影响 的 是 用 户 。cd 使 你 从 一 个 目录 
转 到 另 一 个 目录 ,就 如 同 你 从 一 个 房间 走 到 另 一 个 房间 。pwd 打印 出 当前 工作 目录 。 在 上 
面 的 例子 中 ，demodir 是 experiments 的 一 个 子 目 录 , 而 experiments 位 于 yourname 之 下 ， 
yourname 位 于 home 之 下 ,home 位 于 根 目 录 之 下 , 根 目录 用 “/” 表 示 ，。 


4.2.3 文件 操作 命令 
现在 在 这 棵 目录 树 中 创建 一 些 文件 : 


$ cd demodir 
$ cp /etc/group x 


S cat x 
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root::0: 
bin::1:bin,daemon 
users: :200. 

S cp x copy. of.x 

$ mv copy. of.x y 

S cdc 

S cp../a/x d2/xcopy 

$ 1n../a/x di/xlink 

$ ls > dl/xlink 

S cp dl/xlink z 

S rm../../demodir/c/d2/../z 
$ cd../.. 

S cat demodir /a/x 

( 想 想 接着 会 显示 出 什么 ?) 


为 了 演示 各 种 文件 操作 命令 ,特意 设计 了 上 述 命令 操作 序列 ,请 按照 上 面 的 步骤 自己 建 
立 文件 , 想 一 下 最 后 一 个 命令 会 产生 怎样 的 结果 。 这 个 例子 中 用 了 一 些 最 常用 的 文件 处 理 
M. cp 用 来 复制 一 个 文件 ,在 前 面 的 章节 中 已 经 编写 了 一 个 cp 的 简易 版 本 。cat 命令 将 
文件 内 容 复制 到 标准 输出 文件 。myv 命令 可 以 重 命名 一 个 文件 ,就 像 在 第 一 个 例子 中 那样 ; 
也 可 将 文件 移动 到 为 一 个 目录 ,就 像 在 第 二 个 例子 中 那样 。rm 命令 删除 一 个 文件 ,请 注意 目 
录 路 径 可 能 包含 “.. ”及 多 个 目录 元 素 。 符 号 “.. ”表示 上 一 级 目录 , 即 父 目录 。 一 系列 用 单 
和 料 杠 分 隔 的 目录 名 指出 了 能 到 达 指 定 对 象 的 一 条 路 经 ,注意 此 时 并 未 改变 用 户 所 处 的 位 置 ， 
上 例 中 采用 这 种 间接 的 方法 删除 了 文件 “z”。 


demodir 





4.2 对 同一 文件 的 两 个 链接 


文件 的 复制 .显示 文件 的 内 容 和 重 命名 是 任何 计算 机 系统 都 会 提供 的 操作 ,而 命令 ln 则 
不 是 很 常见 ,但 它 却 是 Unix 的 一 个 基本 操作 。 如 在 上 例 中 生成 了 对 一 个 已 存在 文件 . . /a/x 
的 一 个 链接 , 这 个 链接 称 为 dl/xlink。 如 图 4. 2 所 示 , 称 为 x 的 项 位 于 目录 demodir/a 中 , 称 
为 xlink 的 项 位 于 目录 demodir/c/dl 中 。x 和 xlink 都 称 为 链接 。 一 个 链接 是 指向 文件 的 一 
个 指针 。../a/x 和 di/xlink 都 指向 硬盘 上 同一 数据 块 。 上 例 中 ,下 一 个 命令 ls  dl/xlink 
将 ls 的 输出 作为 文件 xlink 的 内 容 。 那 么 当 执行 cat .. /a/x 时 将 会 发 生 什么 呢 ? 
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4.2.4 针对 目录 树 的 命令 
有 些 Unix 命令 是 对 整个 树 结构 进行 操作 ,以 下 是 一 些 例子 : 
ls -R 


ls 命令 用 来 列 出 目录 的 内 容 , 选 项 -R 要 求 列 出 指定 目录 及 其 子 目 录 的 所 有 内 容 。 在 前 
面 的 章节 中 已 经 给 出 了 一 个 ls 的 版 本 ,但 要 完成 选项 -R 要 求 的 功能 ,还 需要 做 一 些 工 作 。 


chmod — R 


chmod 命令 用 来 修改 文件 的 许可 权限 位 ,选项 -R 要 求 修 改 子 目录 中 所 有 文件 的 许可 
权限 。 


du 


du 是 disk usage( 硬 盘 使 用 ) 的 缩写 ,该 命令 给 出 指定 目录 及 其 子 目 录 下 所 有 文件 占用 硬 
盘 中 数据 块 的 总 数 。 


find 


find 命令 将 在 一 个 目录 及 其 所 有 子 目 录 中 检索 符合 要 求 的 文件 和 目录 。 例 如 ,可 以 检索 
一 棵 目录 树 中 所 有 大 于 1MB、 上 周末 被 修改 过 、 可 被 所 有 用 户 阅 读 的 文件 。 

Unix 中 目录 树 是 文件 系统 的 一 个 重要 组 成 部 分 ,其 他 有 很 多 命令 都 跟 目 录 树 有关, 读者 
可 以 目 己 试 着 找 一 找 。 


4.2.5 目录 树 的 深度 几乎 没有 限制 


目录 能 够 包含 多 个 文件 和 子 目 录 。 系 统 并 未 对 目录 树 的 深度 加 以 限制 。 但 是 ,有 可 能 
所 建 的 目录 树 太 深 以 至 超过 许多 命令 允许 的 范围 。 

注意 : 如 果 你 想 尝 试 以 下 的 试验 ,请 在 自己 的 机 器 上 做 。 如 果 在 学 校 或 工作 地 点 进行 试 
验 , 那 里 的 系统 管理 员 肯 定 会 不 高 兴 。 

这 是 一 个 简单 的 命令 脚本 (关于 脚本 的 解释 详 见 第 8 章 )。 


while true 

do 
mkdir deep — well 
cd deep - well 


done 


woe :在 程序 运行 1、2 秒 后 就 按 下 Ctrl-C, 它 也 会 创建 一 个 非常 深 的 级 联 目录 树 。 那 
么 du 命令 对 这 个 级 联 目录 会 产生 什么 效果 ? find 和 Is -R 命令 又 会 如 何 呢 ? 

C Uus 的 很 多 版 本 中 ,下 述 命令 rm -r deep -well 将 不 起 作用 ,考虑 一 下 如 何 才 能 删 
除 如 此 深 的 目录 结构 。 
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4.2.6 Unix 文件 系统 小 结 


这 个 小 节 中 从 用 户 的 角度 观察 了 Unix 的 文件 系统 。 硬 盘 上 呈现 了 一 个 能 够 在 深度 和 
宽度 上 广泛 延伸 的 目录 树 结构 ,Unix 提供 了 很 多 命令 来 和 这 种 结构 的 对 象 协 同 工 作 。Unix 
系统 中 的 所 有 文件 都 存在 于 这 种 结构 中 。 

它们 是 如 何 工 作 的 ?目录 是 什么 ?如 何 知道 文件 所 处 的 目录 ? 从 一 个 目录 转换 到 为 一 
个 目录 意味 着 什么 ? pwd 如 何 得 知 你 当前 所 处 的 位 置 ? 这 些 问题 将 引导 下 面 的 学 习 。 


4.3 Unix 文件 系统 的 内 部 结构 


硬盘 实际 上 是 由 一 些 磁性 盘 片 组 成 的 计算 机 系统 的 一 个 设备 。 前 面 章节 中 所 提 及 的 文 
件 系统 是 对 该 设备 的 一 种 多 层次 的 抽象 。 


4.3.1 第 一 层 抽象 : 从 磁盘 到 分 区 


一 个 磁盘 能 够 存储 大 量 的 数据 。 就 像 一 个 国家 能 被 划分 成 州 或 县 ,一 个 磁盘 可 被 划分 
成 分 区 ,以 便 在 一 个 大 的 实体 内 创建 独立 的 区 域 。 每 个 分 区 都 可 以 看 作 是 一 个 独立 的 磁盘 。 


4.3.2 第 二 层 抽 和 象 : 从 磁盘 到 块 序列 


一 个 硬盘 由 一 些 磁 性 盘 片 组 成 。 每 个 盘 片 的 表面 都 被 划分 为 很 多 同心 圆 , 这 些 同心 圆 
称 作 磁道 ,每 个 磁道 又 进一步 被 划分 成 扇 区 ,就 像 郊 外 的 街道 被 划分 成 居住 单元 。 每 个 慎 区 
可 以 存储 一 定 字 节 数 的 数据 ,例如 每 个 扇 区 有 512 字 节 。 扇 区 是 磁盘 上 的 基本 存储 单元 , 现 
在 的 磁盘 包含 大 量 的 扇 区 。 图 4. 3 显示 了 序列 号 是 如 何 分 配给 磁盘 块 的 。 


给 数据 块 分 
配 编号 ， 使 
得 磁盘 看 
来 像 一 个 数 
组 








01234567891011... 
图 4.3 为 数据 块 分 配 编 号 


为 磁盘 块 编号 是 一 种 很 重要 的 方法 。 给 每 个 磁盘 块 分 配 连续 的 编号 使 得 系统 能 够 计算 
磁盘 上 的 每 个 块 。 可 以 一 个 磁盘 接 一 个 磁盘 地 从 上 到 下 给 所 有 的 块 编号 ,还 可 以 一 个 磁道 
接 一 个 磁道 地 从 外 向 里 给 所 有 的 块 编号 。 就 像 给 每 条 街道 上 的 每 所 房子 编号 一 样 ,磁盘 上 
存储 数据 的 软件 给 磁盘 上 每 条 磁道 上 的 每 个 块 分 配 了 一 个 序号 。 

一 个 将 磁盘 扇 区 编号 的 系统 使 得 我 们 可 以 把 磁盘 视 为 一 系列 块 的 组 合 。 


4.3.3 第 三 层 抽象 : 从 块 序列 到 三 个 区 域 的 划分 
文件 系统 可 以 用 来 存储 文件 内 容 、 文 件 属性 (文件 所 有 者 .日 期 等 ) 和 目录 ,这 些 不 同类 
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型 的 数据 是 如 何 存储 在 被 编号 的 磁盘 块 上 的 呢 ? 
Unix 使 用 了 一 个 简单 的 方法 。 如 图 4.4 所 示 , 它 将 这 些 磁盘 块 分 成 了 3 部 分 。 





内 空 存储 在 这 里 
图 4.4 文件 系统 的 三 个 区 域 


一 部 分 称 为 数据 区 ,用 来 存放 文件 内 容 。 另 一 部 分 称 为 i- 节点 表 (inode table) ,用 来 存 
放 文件 属性 。 第 三 部 分 称 为 超级 块 (superblock) ,用 来 存放 文件 系统 本 身 的 信息 。 文 件 系 统 
由 这 3 部 分 组 合 而 成 ,其 中 任 一 部 分 都 是 由 很 多 有 序 磁盘 块 组 成 的 。 

(1) 超级 块 

文件 系统 中 的 第 一 个 块 被 称 为 超级 块 。 这 个 块 存放 文件 系统 本 身 的 结构 信息 。 例 如 ， 
超级 块 记录 了 每 个 区 域 的 大 小 。 超 级 块 也 存放 未 被 使 用 的 磁盘 块 的 信息 。 不 同 版 本 Unix 
的 超级 块 的 内 容 和 结构 稍 有 不 同 , 可 以 察看 联机 帮助 和 头 文件 ,以 确定 你 的 系统 的 超级 块 所 
. 包含 的 内 容 。 

(2) i- 节 点 表 

文件 系统 的 下 一 个 部 分 被 称 为 1- 节点 表 。 每 个 文件 都 有 一 些 属性 ,如 大 小 、 文 件 所 有 者 
和 最 近 修 改 时 间 等 。 这 些 性 质 被 记录 在 一 个 称 为 -节点 的 结构 中 。 所 有 的 i- 节点 都 有 相 
同 的 大 小 ,并 且 i- 节 点 表 是 这 些 结构 的 一 个 列表 。 文 件 系统 中 的 每 个 文件 在 该 表 中 都 有 一 
个 i- 节 点 。 如 果 你 有 root 权限 ,就 可 以 像 操 作文 件 一 样 将 分 区 打开 ,阅读 并 显示 i- 节 点 表 。 
在 显示 utmp 文件 时 就 用 过 类 似 的 技术 。 

以 下 这 一 点 很 重要 : 表 中 的 每 个 i- 节点 都 通过 位 置 来 标识 。 例 如 ,标识 为 2 的 i- 节 点 
(inode 2) 位 于 文件 系统 i- 节 点 表 中 的 第 3 个 位 置 。 

(3) 数据 区 

文件 系统 的 第 3 个 部 分 是 数据 区 。 文 件 的 内 容 保 存在 这 个 区 域 。 磁 盘 上 所 有 块 的 大 小 
都 是 一 样 的。 如 果 文 件 包含 了 超过 一 个 块 的 内 容 , 则 文件 内 容 会 存放 在 多 个 磁盘 块 中 。 一 
个 较 大 的 文件 很 容易 分 布 在 上 千 个 独立 的 磁盘 块 中 。 那 么 ,系统 是 如 何 跟踪 这 些 独 立 的 磁 
盘 块 呢 ? 


4.3.4 文件 系统 的 实现 : 创建 一 个 文件 的 过 程 


文件 的 内 容 和 属性 分 区 存放 的 想法 看 起 来 很 简单 ,但 实际 上 它 是 如 何 工 作 的 呢 ? 创建 
一 个 新 文件 的 时 候 又 会 发 生 什么 ? 考虑 以 下 命令 : 


$ who > userlist 


当 这 个 命令 完成 时 ,文件 系统 中 增加 了 一 个 存放 命令 who 输出 内 容 的 新 文件 。 这 是 怎 
么 回 事 ? 
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文件 有 内 容 和 属性 ,内 核 将 文件 内 容 存 放 在 数据 区 ,文件 属性 存放 在 i- 节 点 ,文件 名 存 
放 在 目录 。 图 4.5 显示 了 创建 一 个 文件 的 例子 ,这 个 新 文件 需要 3 个 存储 块 来 存放 各 部 分 的 


数据 。 









LU P 在 数据 块 中 存储 文件 内 容 
47 
ES A eee Wik 
在 i- 节 点 中 存储 文件 信息 
| 增加 到 目录 的 入 口 az 
文件 所 使 用 的 数据 块 列表 — 
图 4.5 文件 的 内 部 结构 
创建 一 个 新 文件 的 4 个 主要 操作 如 下 。 
(1) 存储 属性 
文件 属性 的 存储 : 内 核 先 找到 一 个 空 的 i- 节 点 。 图 4.5 中 ,内 核 找 到 i- 节点 47。 内 核 
把 文件 的 信息 记录 其 中 。 
(2) 存储 数据 


文件 内 容 的 存储 : 由 于 该 新 文件 需要 3 个 存储 磁盘 块 ,因此 内 核 从 自由 块 的 列表 中 找 出 
3 个 自由 块 。 图 4.5 中 , 它 找 到 块 627,200 和 992。 内 核 缓冲 区 的 第 一 块 数据 复制 到 块 627， 
下 一 块 数据 复制 到 块 200, 最 后 一 块 数据 复制 到 块 992 。 

(3) 记录 分 配 情况 

文件 内 容 按 顺序 存放 在 块 627、200 和 992 中 。 内 核 在 i- 节 点 的 磁盘 分 布 区 记录 了 上 述 
的 块 序列 。 磁 盘 分 布 区 是 一 个 磁盘 块 序号 的 列表 ,这 3 个 编号 放 在 最 开始 的 3 个 位 置 。 

(4) 添加 文件 名 到 目录 

新 文件 的 名 字 是 userlist。Unix 如 何在 当前 的 目录 中 记录 这 个 文件 ? 答案 很 简单 。 内 
核 将 和 人口 (47,userlist) 添 加 到 目录 文件 。 文 件 名 和 i- 节 点 号 之 间 的 对 应 关系 将 文件 名 和 文 
件 的 内 容 及 属性 连接 了 起 来 。 这 个 问题 将 在 下 面 进一步 地 讨论 。 


4.3.5 文件 系统 的 实现 : 目录 的 工作 过 程 


目录 是 一 种 包含 了 文件 名 字 列 表 的 特殊 文件 。 不 同 版 本 的 Unix 目录 的 内 部 结构 不 同 ， 
但 是 它们 的 抽象 模型 总 是 一 致 的 一 一 一 个 包含 i- 节 点 号 和 文件 名 的 表 。 
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i- 548 ”文件 名 
2342 
43989 P. 
3421 hello. c 
933870 myls. c 





(OD 探讨 目录 内 部 
可 以 通过 命令 ls -1ia( 选 项 第 一 位 是 数字 1) 来 看 目录 的 内 容 : 


$ ls - lia demodir 
177865 . 

529193 .. 

588277 a 

200520 c 

204491 y 

$ 


输出 的 是 文件 名 和 对 应 的 i- 节点 号 。 例 如 ,文件 名 y 对 应 于 i- 节 点 号 204491。 当 前 目 
录用 “. ”表示 ,i- 节 点 号 是 177865。 这 意味 着 有 关 大 小 .文件 所 有 者 .组 等 各 项 关于 当前 目录 
的 信息 存放 在 i- 节点 表 中 的 编号 为 177865 的 结构 中 。 

ls 的 选项 -i 和 -1( 数 字 1 而 不 是 字母 0) 可 能 有 点 陌生 。 选 项 -i 告诉 ls 在 列表 中 包含 i 
-节点 号 ,选项 -1 要 求 每 行列 出 一 个 文件 ,在 demodir 版 本 上 尝试 这 个 命令 ,以 查看 所 得 到 
的 ji- 节点 号 。 

(2) 指向 同一 文件 的 多 重 链 接 

可 以 使 用 命令 ls -i 查看 系统 上 任何 一 个 文件 的 i- 节点 号 。 例 如 ,可 以 查看 系统 上 根 目 
录 中 各 文件 的 i- 节点 号 : 


$ ls ~ia/ 
2 . 28673 etc 11 lost + found 438292 shlib 
2 .. 311297 home 4097 mnt 40961 tmp 
3 auto 8832  home2 108545 opt 18433 usr 
26625 bin 24646 initrd 1 proc 10241 var 
403457 boot 24579 install 24681 root ` 183 xfer. log 
225281 dev 161797 lib 233473 sbin 183 transfers 


这 个 列表 含有 两 个 重要 的 例子 。 第 一 ,在 右 下 角 有 被 称 为 xfer. log 和 transfers 的 两 个 
文件 。 这 两 个 文件 都 拥有 i- 节 点 号 183。 因 此 ,两 个 文件 都 指向 同一 个 i- 节 点 。i- 节 点 实 
际 上 代表 了 一 个 文件 ,i- 节 点 包含 了 文件 的 属性 和 数据 块 的 列表 。 因 此 , xfer. log 和 
transfers 是 同一 个 文件 的 两 个 不 同名 字 。 这 有 点 像 电 话 短 里 的 两 个 不 同 的 电话 号 码 所 对 应 
的 电话 机 有 可 能 在 同一 所 房子 了 。 


”电话 筹 的 比喻 不 是 完全 恰当 ,因为 两 个 不 同 的 人 都 可 能 住 在 那个 房子 。 请 在 网 络 编程 章节 中 了 解 port 的 概念 。 
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在 根 目录 中 另 一 个 重要 的 例子 是 左上 角 的 “.” 和 ”“..”, 这 两 项 都 有 i 一 节点 号 2, 所 以 
Al. . ”都 指向 同一 个 目录 。 当 前 目录 怎么 会 和 父 目 录 相 同 呢 ?” 实际 上 在 大 多 数 情 况 下 , 它 
们 是 不 同 的 , 根 目录 比较 特别 , 当 用 Unix 命令 mkfs 创建 了 一 个 文件 系统 ,mkfs 将 根 目录 的 
父 目录 指向 目 己 。 


4. 3.6 文件 系统 的 实现 : cat 命令 的 工作 原理 

现在 已 经 看 到 了 创建 一 个 新 的 文件 时 内 部 所 发 生 的 事情 ,例如 who > userlist. 当 读 取 
一 个 文件 时 又 会 发 生 什么 呢 ? 读 取 命 令 如 何 工作 ?对 如 下 的 命令 : 

$ cat userlist 


采用 从 目录 文件 一 步 一 步 找到 数据 的 方法 来 加 以 了 解 。 

(1) 在 目录 中 寻找 文件 名 

文件 名 存储 在 目录 文件 中 。 内 核 在 目录 文件 中 寻找 包含 字符 串 userlist 的 记录 。 
userlist 所 在 的 记录 包含 编号 为 47 的 i- 节点 号 ,如 图 4.6 Pra. 


$ cat userlist 


从 文件 名 到 文件 内 容 : 
在 目录 中 寻找 文件 名 
使 用 编号 定位 -节点 
i- 节 点 包含 数据 块 的 
列表 








4.6 从 文件 名 到 磁盘 块 


(2) 定位 i- 节 点 47 并 读 取 其 内 容 

内 核 在 文件 系统 中 的 i- 节 点 区 域 找到 i- 节点 47。 定 位 一 个 i- 节点 可 能 需要 一 些 简 单 
的 计算 ,所 有 的 i- 节 点 大 小 相同 ,每 个 磁盘 块 都 包含 相同 数量 的 1- 节点。 为 了 提高 访问 效 
率 , 内 核 有 可 能 将 i- 节 点 置 于 缓冲 区 中 。i- 节 点 包含 数据 块 编号 的 列表 。 

(3) 访问 存储 文件 内 容 的 数据 块 

通过 以 上 过 程 ,内核 已 经 可 以 知道 文件 内 容 存放 在 哪些 数据 块 上 ,以 及 它们 的 顺序 。 由 
于 cat 不 断 地 调用 read. 函数 ,使 得 内 核 不 断 将 字 节 从 磁盘 复制 到 内 核 缓冲 区 ,进而 到 达 用 户 
空间 。 | 
所 有 从 文件 读 取 数据 的 命令 ,例如 cat, cp, more, who 等 ,都 是 将 文件 名 传 给 open Ki 


D 参考 Latham & Jaffe 编著 的 Im My Own Grandpa. 1947 对 相关 主题 的 讨论 。 
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问 文件 内 容 。 对 open 的 每 次 调用 都 是 先 在 目录 中 寻找 文件 名 ,然后 根据 目录 中 的 i- 节 点 号 
获得 文件 的 属性 ,最 终 找到 文件 的 内 容 。 

现在 可 以 想象 一 下 在 open 一 个 没有 读 或 写 权 限 的 文件 时 将 发 生 什么 情况 。 内 核 首 先 根 
据 文件 名 找到 i- 节 点 号 ,然后 根据 i- 节 点 号 找到 i- 节 点 。 在 i- 节 点 中 ,内 核 找到 文件 的 权 
限 位 和 拥有 者 的 用 户 ID。 如 果 权 限 位 设置 你 的 用 户 ID 对 文件 没有 访问 权限 , 则 open 返回 
一 1 并 且 将 全 局 变量 errno 的 值 设 为 EPERM, 

通过 对 目录 、i- 节 点 和 数据 块 的 描述 ,相信 能 提高 对 其 他 的 文件 操作 的 理解 。 可 以 通过 
阅读 一 些 版 本 的 Unix 系统 源 代码 来 加 以 检验 。 


4.3.7 i 一 节点 和 大 文件 


Unix 文件 系统 如 何 跟踪 大 文件 呢 ? 其 实 前 一 个 章节 中 的 解释 并 不 完整 。 简 短 地 说 , 问 
题 是 : 


事实 1 一 个 大 的 文件 需要 多 个 磁盘 块 
事实 2 在 i- 节 点 中 存放 有 磁盘 块 分 配 列表 
问题 一 个 固定 大 小 的 1- 节点 如 何 存 储 较 长 的 分 配 列 表 ? 
解决 方案 将 分 配 列表 的 大 部 分 存储 在 数据 块 ,在 i- 节点 中 存放 指向 那些 块 的 指针 。 
考虑 图 4.7 中 描述 的 解决 方案 。 这 个 文件 需要 14 个 数据 块 存储 它 的 内 容 。 因 此 ,分 配 
链表 包含 14 个 块 的 编号 。 但 是 很 遗憾 ,文件 的 i- 节点 只 包含 一 个 含有 13 个 项 的 分 配 链 表 。 
14 个 编号 如 何 放 到 13 个 项 中 呢 ? 其 实 很 简单 。 将 分 配 链表 中 的 前 10 个 编号 放 到 i- 节点 
中 ,将 最 后 4 个 编号 放 到 一 个 数据 块 中 。 这 有 点 像 把 某 些 货物 放 在 架子 上 而 把 剩 下 的 放 在 仓 
库 里 。 
更 具体 地 说 ,就 是 该 i- 节 点 的 链表 包含 分 配 13 个 块 编号 的 空间 ,链表 里 的 前 10 个 项 像 







这 节点 


块 13 存 储 着 包 
含 更 多 二 级 间 
接 块 的 那个 块 
的 编号 。 这 个 
分 配 列表 从 i- 节 分配 列表 在 间接 ” 块 12 存 储 着 包含 更 多 ”间接 块 。 

点 列表 中 的 前 10” 块 中 继续 。 块 11 ”间接 块 的 那个 数据 块 

个 块 开始 。 存储 着 那个 块 的 ”的 编号 。 这 个 块 被 称 

编号 。 做 二 级 间接 块 。 





图 4.7 在 数据 区 延伸 的 块 分 配 列 表 
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“架子 空间 ”一 在 那 10 个 项 中 的 块 编号 指向 的 是 文件 的 实际 数据 。 如 果 分 配 链表 有 多 于 
10 个 的 项 , 则 剩 下 的 块 编号 不 是 存储 在 i- 节点 ,而 是 存储 在 数据 区 。 存 放 多 余 编 号 的 数据 
块 的 编号 存储 在 1- 节 点 的 第 11 个 项 中 一 一 就 像 书 店 里 有 个 便条 贴 在 架子 上 写 着 “ 剩 下 的 货 
物 在 仓库 的 3 号 架子 上 ”。 

注意 到 这 个 文件 实际 上 用 了 15 个 数据 块 。 其 中 14 个 用 来 存储 文件 的 内 容 , 剩 下 的 工 个 
存放 着 i- 节点 的 分 配 链 表 无 法 存放 的 那 部 分 内 容 。 这 个 额外 的 块 被 称 为 间接 块 。 

(1) 间接 块 饱 和 时 如 何 处 理 ? 

当 越 来 越 多 的 字 节 被 添加 至 文件 ,内 核 将 分 配 更 多 的 数据 块 ,因此 分 配 列表 越 来 越 长 ， 
需要 更 多 的 存储 空间 。 分 配 列 表述 早 会 充满 间接 块 ,所 以 内 核 将 开始 引入 第 二 个 额外 块 。 
内 核 将 如 何 处 理 第 二 个 额外 块 的 块 编号 ?内核 需 将 第 二 个 间接 块 的 编号 放 入 i~ 节 点 的 第 12 
个 项 中 吗 ? 可 以 这 么 做 ,但 是 这 样 意味 着 文件 仅 能 含有 3 个 额外 块 。 实 际 上 ,内 核 并 不 把 第 
二 个 额外 块 的 编号 放 和 人 i- 节 点 ,取而代之 的 是 ,内 核 开 辟 另 外 一 个 块 来 存放 这 些 额外 间接 块 
的 列表 。i 一 节点 的 第 12 项 并 不 存放 第 二 个 额外 块 的 编号 ,而 是 存放 那个 存储 着 第 2、3、4 及 
后 继 额 外 块 的 编号 的 块 的 编号 。 这 个 块 被 称 为 二 级 间接 块 。 

(2) 二 级 间接 块 饱和 时 如 何 处 理 ? 

当 二 级 间接 块 饱和 时 ,内 核 开 辟 另 一 个 新 的 二 级 间接 块 。 内 核 并 不 把 这 个 新 的 间接 二 
级 块 的 编号 放 入 i- 节点 的 列表 。 而 是 创建 一 个 三 级 间接 块 来 存放 二 级 间接 块 的 编号 以 及 这 
个 文件 将 来 所 需要 的 所 有 间接 二 级 块 的 编号 。i- 节 点 列表 的 最 后 一 项 正 是 记录 着 这 个 三 级 
间接 块 的 编号 。 

(3) 三 级 间接 块 饱 和 时 又 将 如 何 处 理 ? 

文件 到 达 了 极限 。 如 果真 想 使 用 大 文件 ,可 以 创建 一 个 由 更 大 的 磁盘 块 构成 的 文件 系 
统 。 当 创建 该 文件 系统 时 ,不 仅 能 够 定义 i- 节 点 表 和 数据 区 的 大 小 ,而 且 能 够 定义 磁盘 块 的 
大 小 。 磁 盘 抉 并 不 需要 和 磁盘 扇 区 同样 大 小 ,通常 一 个 磁盘 块 包含 若干 个 肩 人 区， 

由 于 大 文件 的 存储 管理 需要 更 多 的 开销 ,因此 这 样 的 磁盘 分 配 系 统 对 小 文件 来 说 是 快 
捷 高 效 的 。 当 文件 逐步 增长 时 ,内 核 使 用 更 多 的 磁盘 空间 去 维护 越 来 越 长 的 分 配 列表 。 在 
文件 中 定位 一 个 特定 的 位 置 可 能 需要 获取 若干 个 间接 块 以 得 到 数据 块 的 编号 。 


4.3.8 Unix 文件 系统 的 改进 


前 一 小 节 描 述 了 Unix 文件 系统 的 结构 。 不 同 版 本 的 Unix 使 用 这 种 模型 的 不 同 版 本 ， 
这 个 经 典 的 简洁 方法 有 些 严重 的 不 足 之 处 。 例 如 ,超级 块 就 是 一 个 问题 。 如 果 这 个 块 损坏 
了 , 则 整个 文件 系统 的 结构 信息 就 没有 了 ,新 版 本 的 Unix 在 文件 系统 中 备份 了 这 个 块 的 
副本 。 

分 块 是 另 一 个 问题 。 由 于 文件 的 创建 和 删除 , 自由 块 将 遍布 磁盘 。 一 种 方案 是 在 文件 
系统 中 创建 被 称 为 柱 面 组 (cylinder group) 的 微 文件 系统 . 

但 是 这 个 经 典 的 模型 并 未 过 时 。 文 件 仍旧 存储 在 数据 区 的 块 中 ,文件 属性 仍旧 存储 在 i 
-节点 表 中 的 i- 节点 中 ,i- 节 点 包含 着 磁盘 的 分 配 列表 ; 目录 仅 是 文件 名 和 ji -节点 号 的 列 
表 。 现 在 再 来 回顾 一 下 在 前 面 一 章 中 所 创建 和 探讨 的 目录 树 。 在 理解 了 文件 系统 的 内 部 结 
构 以 后 ,再 看 目录 和 文件 的 结构 就 很 清楚 了 。 
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4.4 PR ^H Hox 


在 了 解 了 一 个 Unix 文件 系统 的 目录 结构 之 后 ,就 能 够 知道 目录 树 究竟 是 怎么 回 事 , 并 
且 能 够 理解 不 同 的 目录 命令 是 如 何 工 作 的 。 


4.4.1 理解 目录 结构 


用 户 看 到 的 文件 系统 是 目录 和 子 目 录 的 集合 。 每 个 目录 能 够 包含 文件 和 子 目 录 , 每 个 
子 目 录 有 一 个 父 目 录 , 这 棵 树 的 结构 常用 线条 连接 的 方块 图 来 表示 。 文 件 在 一 个 目录 中 是 
什么 意思 ? 专业 术语 “dl 是 c 的 一 个 子 目录 ”又 是 什么 意思 ? 图 上 的 线条 代表 什么 意思 ? 

在 文件 系统 内 部 ,目录 是 一 个 包含 文件 名 与 i- 节 点 对 的 列表 的 文件 。 从 用 户 的 角度 看 
到 的 是 一 个 文件 名 的 列表 ,而 从 Unix 的 角度 看 到 的 是 一 个 被 命名 的 指针 的 列表 ,如 图 4.8 
BIN. 


用 户 角度 系统 角度 


| demodir 





Kl 4.8 目录 树 的 两 种 不 同 视图 


如 何 从 用 户 的 角度 转换 到 系统 的 角度 ? 通过 在 图 中 添加 i- 节 点 号 ,就 能 够 了 解 目 录 树 
是 如 何 连接 在 一 起 的 。 使 用 ls -iaR 可 以 列 出 一 棵 树 中 的 所 有 文件 的 i- 节 点 号 。 


$ ls - iaR demodir 


865 . 1933 .. 277] a 520 c 491 y 
demodir/a: 

277 . 865 e. 402 x 

demodir/c: 

520 . 865 - 651 di 247 d2 
demodir/c/dl. 

651 . 520 2. 402 xlink 

demodir/c/d2.: 

247 . 520 D. 680 xcopy 


S 
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图 4.9 是 上 例 的 图 示 。 


用 户 角度 系统 角度 


demodir 491 Ys | 





图 4.9 文件 名 和 指向 文件 的 指针 


(1)“ 文 件 在 目录 中 ”的 真正 含义 | 

一 般 都 说 文件 存放 在 某 个 目录 中 ,但 是 现在 已 经 知道 目录 中 存放 的 只 是 文件 在 1-7 795 
表 的 入 口 ,而 文件 的 内 容 则 存储 在 数据 区 。 文 件 在 某 个 目录 中 是 什么 意思 ? 例如 ,从 用 户 的 
角度 来 看 ,文件 y 在 目录 demodir 中 ,而 从 系统 角度 来 看 ,看 到 的 则 是 目录 中 有 一 个 包含 文件 
名 y 和 i- 节 点 号 为 491 的 入 口 。 

类 似 地 , “文件 x 在 目录 a 中 ”意味 着 在 目录 a 中 有 一 个 指向 i- 节点 402 的 链接 ,这 个 链 
接 所 附加 的 文件 名 为 x。 注 意 , 这 一 点 很 重要 ,在 左 端 较 低 处 标 为 dl 的 目录 包含 一 个 指 疝 i 
-节点 402 的 链接 ,那个 链接 被 称 为 xlink。 称 为 demodir/a/x 的 链接 和 称 为 demodir/c/d1/ 
xlink 的 链接 指向 同一 个 文件 。 

简短 地 说 ,目录 包含 的 是 文件 的 引用 ,每 个 引用 被 称 为 链接 。 文 件 的 内 容 存 储 在 数据 
A ,文件 的 属性 被 记录 在 一 个 被 称 为 -节点 的 结构 中 ,i- 节 点 的 编号 和 文件 名 存储 在 目录 
中 。“ 目 录 包 含 子 目录 ”的 原理 与 此 相同 。 

(2)“ 目 录 包 含 子 目录 ”的 真正 含义 

从 用 户 的 角度 来 看 ,目录 a 是 目录 demodir 的 一 个 子 目 录 , 那 么 在 系统 内 部 究 竞 是 如 何 
运作 的 呢 ? 实际 上 demodir 包含 一 个 指向 那个 子 目录 i- 节点 的 链接 。 从 系统 角度 来 看 ,最 
上 面 一 个 表 包 含 一 个 指向 i- 节点 277 的 链接 , 称 为 a。 如 何 知道 277 是 左边 那个 目录 的 1- 
节点 号 呢 ? 每 个 目录 都 有 一 个 i- 节 点 ,内 核 在 每 个 目录 都 设置 一 个 指向 目录 本 身 的 i- 节 所 
HAO; 这 个 人 口 被 称 为 “.”。 在 左边 的 小 方 框 中 ,点 表示 i- 节 点 277, 因 此 左边 的 目录 表示 
1 一 

如 图 4. 10 所 示 ,i- 节 点 520 的 目录 是 如 何 被 包含 在 demodir 中 的 , 它 在 目录 demodir 中 
的 名 字 被 标识 为 <。 类似 地 ,i- 节 点 247 是 另 一 个 目录 ,名 字 为 42, 它 是 i- 节 点 520 的 一 个 
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子 目 录 。 


用 户 角 度 系统 角度 


demodlr 


| 865 |- | 











[247 |* 
[520 [+s 


CL 
一 
ZTE | 


图 4.10 目录 名 和 指 咎 目录 的 指针 





(3)“ 目 录 有 一 个 父 目录 ”的 真正 含义 

从 用 户 的 角度 看 目录 d2, 它 的 父 目录 是 c。 这 里 再 次 用 一 个 指向 i- 节 点 的 简单 链接 实 
JU. Hs c 的 i- 节 点 号 为 520, 目 录 d2 包含 一 个 称 为 “.. ”的 人 口 。 这 个 人 口 的 i- 节 点 号 是 
520。“..” 是 父 目录 的 保留 名 字 。 因 此 ,i~ 节 点 520 是 -节点 247 的 父 节 点 。 

(4) 填充 空白 的 i- 节点 号 

如 果 理 解 了 前 面 的 章节 , 接 下 来 就 能 够 填充 图 4. 10 中 的 空余 的 i- 节 点 号 。 如 果 不 知道 
这 些 空白 处 该 填 什么 ,可 以 查看 一 下 ds 的 输出 内 容 并 复习 一 下 前 面 章 节 的 内 容 。 

(5) 多 重 链 接 及 链接 数 

在 demodir 目录 树 中 ,i- 节 点 402 有 两 个 链接 。 一 个 是 在 目录 a 中 , 称 为 x, 另 一 个 在 目 
录 dl 中 , 称 为 xlink。 那 么 哪个 是 原始 文件 ? 哪个 是 指向 它 的 链接 呢 ? 在 Unix 的 目录 结构 
中 ,这 两 个 链接 的 状态 完全 相同 ; 它们 被 称 为 指向 文件 的 硬 链接 。 文 件 是 一 个 i- 节 点 和 一 
些 数据 块 的 结合 ; 链接 是 对 i- 节 点 的 引用 。 可 以 对 一 个 文件 创建 任意 多 的 链接 ， 

内 核 记 录 了 一 个 文件 的 链接 数 。 就 i- 节 点 402 来 说 ,链接 数 至 少 是 2。 因 为 在 文件 系统 
的 其 他 部 分 或 许 还 存在 着 -节点 402 的 其 他 链接 。 链 接 数 被 记录 在 i- 节 点 中 ,同时 是 系统 
调用 stat 返回 值 stat 结构 中 的 一 个 成 员 。 

(6) 文件 名 | | 

在 Unix 的 文件 系统 中 ,文件 没有 文件 名 ,但 是 链接 具有 和 名字。 文件 仅仅 拥有 i- 节 点 号 。 
在 后 面 的 章节 中 ,可 看 到 这 种 方法 的 便利 之 处 ， 


4.4.2 与 目录 树 相关 的 命令 和 系统 调用 


Unix 文件 系统 的 内 部 结构 比较 简单 ,仅仅 是 一 些 相互 链接 的 数据 结构 。 节 点 被 称 为 i- 
节点 ,指针 的 集合 被 称 为 目录 ,叶子 节点 被 称 为 链接 。 通 过 标准 的 Unix 命令 来 对 这 个 树 状 结 
构 进 行 管理 ,例如 mkdir rmdir .mv in 和 rm 等 。 这 些 命令 是 如 何 工作 的 呢 ? Ce E FERE 
些 相 关 的 系统 调用 呢 ? 
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(1) mkdir 
命令 mkdir 用 来 创建 新 的 目录 。 它 接受 命令 行 上 的 一 个 或 多 个 目录 名 ,使 用 mkdir 系统 


调用 : 











| mkdir 
目标 创建 目录 l 
头 文 件 # include < sys/stat. h> 
# include «sys/types. h> 
A K BY int result = mkdir(char * pathname, mode t mode) 
参数 pathname 新 目录 名 
mode PR f B5 HES 
返回 值 一 1 遇 到 错误 
0 成 功 创建 





mkdir 创建 一 个 新 的 目录 节点 并 把 它 链接 至 文件 系统 树 。 即 mkdir 创建 了 这 个 目录 的 i 
- fas 分 配 了 一 个 磁盘 块 用 以 存储 它 的 内 容 ; 在 目录 中 设置 两 个 人 口 :“.” 和 “..”, 并 正确 
配置 了 它们 的 i- 节点 号 ; 在 它 的 父 目录 中 增加 一 个 该 节点 的 链接 。 

(2) rmdir | 

命令 rmdir 用 来 删除 一 个 目录 。 它 接受 命令 行 上 一 个 或 多 个 目录 名 ,使 用 rmdir 系统 








调用 : 
rmdir 

目标 删除 一 个 目录 。 此 目录 必须 为 空 
头 文件 # include «unistd. h> 
BA RY si gg int result = rmdir (const char * path); 
参数 path 目录 名 
返回 值 —1 IC ESI 

0 成 功 删 除 


rmdir 从 目录 树 中 删除 一 个 目录 节点 。 这 个 目录 必须 是 空 的 。 即 除了 “.” 和 “..” 的 入 
口 ,这 个 目录 不 能 包含 其 他 任何 的 文件 和 子 目 录 。 同 时 在 父 目录 中 删除 这 个 目录 的 链接 ， 
如 果 这 个 目录 本 身 并 未 被 其 他 的 进程 占用 , 它 的 i- 节点 和 数据 块 将 被 释放 。 

(3) rm 

命令 rm 用 来 从 一 个 目录 文件 中 删除 一 个 记录 , 它 接受 命令 行 上 一 个 或 多 个 文件 名 ,使 
用 unlink 系统 调用 . 
一 -一 MM LLLA 





unlink 
目标 删除 一 个 链接 
头 文件 # include <unistd. h> 
p E I Rd int result = unlink (const char * path); 
参数 path ”和 需 删 除 的 链接 名 
返回 值 —1 遇 到 错误 
0 成 功 删除 


CC 
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unlink 用 来 删除 目录 文件 中 的 一 个 记录 ,减少 相应 i 一 节 点 的 链接 数 。 如 果 该 i- 节 点 的 
链接 数 减 为 0, 数 据 块 和 1 节点 将 被 释放 。 如 果 该 i- 节 点 有 其 他 的 链接 , 则 数据 块 和 i- 节 点 
将 不 受 影响 。unlink 不 能 被 用 来 删除 目录 。 

(4) In 

命令 In 用 来 创建 一 个 文件 的 链接 ,使 用 系统 调用 link: 


link 

目标 创建 一 个 文件 的 新 链接 
头 文 件 it include «unistd. h> 
B At Jg int result = link (const char * orig, const char * new); 
参数 orig 原始 链接 的 名 字 

new 新 建 链接 的 名 字 
返回 值 一 1 BAR 

0 ALDH Be 


link 生成 一 个 i- 节点 的 链接 。 新 链接 包含 原始 链接 的 i- 节 点 号 并 且 具 有 特定 的 名 字 。 
如 采 已 经 存在 一 个 和 新 链接 名 相同 的 链接 , 则 link 将 失败 。link 不 能 被 用 来 生成 目录 的 新 链 
接 。 

(5) mv 

命令 mv 用 来 改变 文件 和 目录 的 名 字 或 位 置 ， 和 是 这 小 节 中 所 讲述 的 最 为 灵活 的 一 个 命 

。 在 很 多 情况 下 ,mv 仅仅 使 用 系统 调用 rename: 








rename 

目标 重 命名 或 删除 一 个 链接 
头 文件 # include «unistd, h> 
a E IR D int result = rename (const char * from, const char * to); 
参数 from 原始 链接 的 名 字 

to 新 建 链接 的 名 字 
返回 值 —1 JB Fl EE UR 

0 成 功 返回 





rename 用 来 改变 文件 或 目录 的 名 字 或 位 置 。 例 如 ,rename("y"，"y. old") 用 来 改变 文 
件 的 名 字 ,而 rename("y", "c/d2/y. old") 用 来 改变 文件 的 名 字 和 位 置 。rename 适用 于 文件 
和 目录 ,但 是 在 进行 目录 移动 时 有 些 限 制 。 例 如 ,不 能 将 一 个 目录 移动 到 它 的 子 自 录 中 去 。 
考虑 一 下 rename ( " demodir/c", "demodir/d2/c") 将 会 产生 怎样 的 后 果 。 和 link AR S, 
rename 将 删除 第 一 个 参数 所 指定 的 已 存在 的 文件 或 空 目 录 。 

rename 是 如 何 将 一 个 文件 移动 到 另 一 个 目录 的 呢 ? 文件 实际 上 并 不 存在 于 目录 中 , 目 
录 中 存放 的 仅仅 是 它 的 链接 。 因 此 ,rename 将 链接 从 一 个 目录 移动 到 另 一 个 目录 。 将 目录 
y 移动 到 c/d2/y. old 看 起 来 就 像 图 4.11 所 示 。 
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在 rename 执行 之 前 rename (“y”,“c/dl/y.old” ) fuf T Z2 Ji 


FUP Lom 
L402 | xlink | 


图 4.11 一 将 文件 移动 到 新 的 目录 - 


首先 ,在 demodir 中 存在 着 一 个 指向 i- 节点 491 的 链接 , 称 为 y。 然 后 一 个 称 为 y. old 
的 指向 i 一 节点 的 链接 出 现在 c/d2 中 ,而 原来 的 链接 消失 了 。 HEU UH ait eI A 
在 Linux JJ , rename 的 基本 逻辑 是 ; 
5t 复制 链接 至 新 的 名 字 / 位 置 
。 删除 原来 的 链接 | 
Unix 提供 系统 调用 link 和 unlink 完成 这 两 个 操作 。 因 此 ,rename("x"， "z") 是 这 样 运 
作 的 : 


if ( link("x", "z") j= 一 1 ) 
unlink("x") ; 





”实际 上 ,过 去 没有 rename 这 个 系统 调用 ,因此 命令 mv 使 用 系统 调用 link 和 unlink, 7 
内 核 中 增加 系统 调用 rename 解决 了 两 个 问题 。 首 先 ,rename 使 得 重 命名 或 重 定位 一 个 目录 
变 得 更 加 安全 。 过 去 ,一 般 的 用 户 不 能 对 目录 进行 link BE unlink 操作 ， 因此 他 们 没有 办 法 重 
命名 一 个 目录 

43 — ^ fH] rename 的 优点 是 支持 非 Unix 文件 系统 。 在 Unix 中 , 重 命名 一 二 个 文件 或 目 
录 是 通过 改变 链接 完成 的 ,但 是 其 他 的 系统 可 能 不 按 这 种 方式 工作 。 将 通用 方法 rename 添 
加 至 内 核 隐 藏 了 实现 的 细节 ， 使 得 相同 的 代码 能 够 在 各 种 文件 系统 上 运行 

(6) cd | 

cd 用 来 改变 进程 的 当前 目录 。cd 对 进程 产生 影响 ,但 是 并 不 影响 目录 。 一 个 用 户 可 能 
会 说 :“ 我 进入 了 /tmp 目录 ,发 现 一 大 堆 的 垃圾 文件 ”, 而 另 一 个 用 户 可 能 会 说 :“ 我 进入 了 阁 
楼 ,发 现 了 很 多 旧书 ”。cd 使 用 系统 调用 chdir: 








第 4 章 文件 系统 ; 编写 pwd * 113 。 








chdir 
目标 改变 所 调用 进程 的 当前 目录 
头 文件 f include <unistd.h> 
Ba BY Jin By int result = chdir (const char * path); 
参数 path. 要 到 达 的 目录 
返回 值 —1 遇 到 错误 | 
0 成 功 改变 . 


Unix 上 的 每 个 运行 程序 都 有 一 个 当前 目录 ,chdir 系统 调用 改变 进程 的 当前 目录 。 在 系 
统 内 部 ,进程 有 一 个 存放 当前 目录 i- 节点 号 的 变量 。 从 一 个 目录 进入 另 一 个 目录 只 是 改变 
那个 变量 的 值 。 

Tf cd.. 如 何 工作 。 使 用 demodir 这 个 例子 ,假设 现在 位 于 一 个 称 为 c 的 目录 ,那么 , 当 
前 目录 的 i- 节 点 号 是 多 少 ? 如 现在 输入 cd d1, 则 当前 目录 的 i- 节 点 号 是 多 少 ? 内 核 是 如 何 
获得 这 个 值 的 呢 ? 如 果 随 后 输入 cd ../.. , 则 当前 目录 的 i~ 节 点 号 又 是 多 少 ? 内 核 使 用 了 
什么 步骤 获得 该 i- 节点 号 ? 

如 有 果 知 道 如 何 完成 这 个 重要 的 练习 ,那么 已 经 明白 命令 pwd 是 如 何 工作 的 了 。 


4.5 编 写 pwd 


命令 pwd 用 来 显示 到 达 当 前 目录 的 路 径 。 例 如 ,如 果 位 于 demodir/c/d2 HHRMA 
pwd, 就 可 以 看 到 : | 


$ pwd 
/home/ yourname/ exper iments/demodir/c/d2 


这 么 长 的 路 径 存放 在 哪里 呢 ? 其 实 它 并 不 位 于 当前 的 目录 中 。 当 前 目录 称呼 本 身 为 
“.”, 并 且 有 一 个 记 节 点 号 。 目 录 仅 是 相互 连接 的 节点 集合 中 的 一 个 节点 。pwd 如 何 知道 该 
目录 是 c2,c2 的 父 目 录 是 coc 的 父 日 录 是 demodir W? mE | MEE 


4.5.1 pwd 的 工作 过 程 


就 像 本 章 中 所 有 问题 的 答案 一 样 ,这 个 问题 的 答案 也 是 简单 的 : 追踪 链接 , 读 取 目 录 , 一 
个 目录 接着 一 个 目录 地 沿 着 树 向 上 追踪 ,每 步 查 看 “. ”的 i- 节 点 号 ,然后 在 父 目 录 中 查找 该 ; 
-万 皮 的 名 字 , 直 到 到 达 树 的 顶端 。 如 图 4. 12 所 示 。 

丛 当前 目录 (就 是 右 下 角 的 那个 目录 ) 开 始 上 潮 。 在 该 目录 当中 ,所 处 位 置 的 名 称 为 
“GAA IAS 247。 现 在 利用 chdir 向 上 到 达 父 目录 ,查找 含有 i- 节 点 247 HAD. 在 
A Ho pd B A247 称 为 d42。 因 此 ,路 径 的 最 后 一 项 是 d2。 父 目录 的 名 字 是 什么 呢 9 E 
目录 中 , 它 的 名 字 是 “. ”, 拥 有 i- 节点 号 520。 通 过 chdir 进入 它 的 父 目录 ,可 以 看 到 i- 节点 
920 名 字 为 c。 因 此 ,路 径 的 最 后 两 项 是 c/d2。 算 法 是 以 下 3 个 步骤 的 重复 。 
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6 1. “1 947 
865 p> [5 chair. . 
4911 y |— 2. 247 Bog dz" 
chair. . 
— s20- ]3 4. 520 被 称 为 “c” 
Hes L—34 9. ". "Ri 865 
6. 865 Si ER Jj"demodir" 
chair. . 
一 下 一 BATT} s, gis 
402 | xiink | -680 [XCOpy, chair 


4.12 计算 当前 路 径 


CD 得 到 “. ”的 i- 节 点 号 , 称 其 为 nCRE stat), 

(2) chdir. . (使 用 chdir). | 

(3) RB i— PRS n BEM SF CEA opendir.readdir.closedir) 。 

重复 (直到 到 达 树 的 顶端 ) 。 

这 看 起 来 很 简单 ,但 是 也 有 两 个 问题 。 

问题 1: 如 何 知道 已 经 到 达 了 树 的 顶端 ? 在 一 个 Unix 文件 系统 的 根 目 录 中 ,“.” 和 “. .，” 
指向 同一 个 i- 节 点。 编程 者 通常 将 下 一 个 指针 置 为 NULL, 用 来 标识 一 个 链表 结构 的 结束 。 
Unix 的 设计 者 本 可 以 将 根 目录 的 “. . "RNS ,但 是 还 是 决定 将 它 指向 本 身 。 考 虑 一 下 这 个 
设计 的 优点 是 什么 ? 回 到 刚才 的 问题 ,基于 以 上 原因 ，pwd 命令 重复 循环 直到 一 个 目录 的 
“.” 和 “. . ”的 i- 节 点 号 相同 时 ,就 可 以 认为 已 经 到 达 文件 树 的 顶端 。 

问题 2: 如 何以 正确 的 顺序 显示 目录 名 字 ? 可 以 建立 一 个 循环 ,使 用 strcat 或 sprintt 建 
立 目录 名 字 的 字符 串 序列 。 通 过 一 个 递归 的 程序 逐步 到 达 树 的 顶端 来 一 个 接 一 个 地 显示 目 
录 名 ,从 而 避免 了 字符 串 的 管理 。 


4.5.2 pwd 的 一 种 版 本 


/* spwd.c; a simplified version of pwd 

x 

* starts in current directory and recursively 

* climbs up to root of filesystem, prints top part 
* then prints current part 

* . 
* uses readdir() to get info about each thing 
* 

* bug: prints an empty string if run from "/" 
x x/ | 
# include <stdio.h> 
# include <sys/types.h> 
# include <sys/stat.h> 
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i include «dirent. h> 


ino t get inode(char x ); 
void printpathto(ino t); 


void inum to name(ino t, char * , int); 


int main() 

{ 
printpathto( get inode( ".") ); /* print path to here x/ 
putchar( 'in'); /* then add newline */ 
return 0; 


j 


void printpathto( ino t this inode ) 
/* 
* prints path leading down to an object with this inode 
* kindof recursive 
*/ 
( 
ino t my inode ; 
char its name| BUFSIZ]; 
if ( get inode("..") != this inode) 
{ 


chdir( ".."); /* up one dir */ 
inum to name(this inode,its name,BUFSIZ); /* get its name x/ 
my inode = get inode( "."); /x print head x/ 
printpathto( my inode ); | /* recursively «/ 
printf("/%*s", its name ); /x now print x/ 


/* name of this x/ 


j 
void inum to name(ino t inode to find , char * namebuf, int buflen) 
/* 

* looks through current directory for a file with this inode 


* number and copies its name into namebuf 


x*/ 
{ 
DIR * dir ptr; /* the directory */ 
struct dirent x direntp; /x each entry x/ 
dir ptr = opendir( "." ): | 
if ( dir ptr == NULL ){ 
perror( "."). 
exit(1); 


j 
/* 
* search directory for a file with specified inum 


x*/ 
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while ( ( direntp = readdir( dir ptr) ) ! = NULL) 
if ( direntp~>d_ino == inode to find) 
{ 
strncpy( namebuf, direntp —^d name, buflen) ; 
namebuf[buflen -1] = 'X0'; /x just in case x/ 
closedir( dir ptr ); 
return; 
| | 
fprintf(stderr, "error looking for inum * d\n", inode to find); 
exit(1); 
} 
ino t get inode( char * fname ) 
/* 
* returns inode number of the file 
x/ 
{ 
struct stat info; 
if ( stat( fname , &info ) == -1 ){ 
fprintf(stderr, "Cannot stat "); 
perror( fname) ; 
exit(1); 
} 
return info. st_ino; 


} 
下 面 是 命令 pwd 5 spwd 执行 后 的 比较 : 


$ /bin/pwd 

/ home/bruce/experiments/demodir/c/d2 
S spwd 

/ bruce/experiments/demodir/c/d2 

$ 


命令 pwd 将 显示 到 达 树 根 的 路 径 ,而 这 个 版 本 在 到 达 树 根 之 前 就 停止 了 。 问 题 在 娜 儿 呢 ? 是 
不 是 因为 编码 不 当心 导致 的 问题 ? 不 是 ,程序 实际 上 是 完全 按照 原来 的 设想 工作 的 , 它 在 到 达 文 
件 系统 的 根 时 停止 ,只 是 这 个 文件 系统 的 根 并 不 是 这 个 计算 机 上 整 棵 文件 树 的 根 。 

Unix 允许 将 一 个 磁盘 的 存储 组 织 成 一 棵 由 多 棵 树 相 互 连 接 的 树 。 每 个 磁盘 或 磁盘 上 的 
每 个 分 区 都 包含 一 棵 目录 树 。 这 些 独立 的 树 被 连接 成 一 棵 单一 JLP ASE OR 这 个 版 本 
的 pwd 恰 好 碰 上 了 树 之 间 的 连接 地 带 。 


4.6 多 个 文件 系统 的 组 合 : 由 多 棵 树 构成 的 树 


一 个 Unix 系统 有 两 个 磁盘 或 分 区 将 会 如 何 ? 现在 已 经 知道 ,用 一 些 简单 的 抽象 能 够 将 
一 个 单一 的 分 区 组 织 成 一 棵 目录 树 。 但 是 如 果 有 两 个 分 区 ,需要 两 棵 独立 的 树 吗 ? 
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其 他 的 系统 又 是 如 何 做 的 呢 ? 有 些 操作 系统 将 盘 符 或 卷 标 分 配给 每 个 磁盘 或 分 区 ,并 
将 字母 或 名 字 作 为 一 个 文件 全 路 径 的 一 部 分 。 男 一 种 做 法 是 ,有 些 系统 统一 给 所 有 的 磁盘 
分 配 块 的 编号 以 创建 一 个 虚拟 的 单一 磁盘 。 

Unix 使 用 第 三 种 方法 。 每 个 分 区 有 自己 的 文件 系统 树 。 当 计算 机 上 有 多 于 一 个 的 文件 
系统 时 ,Unix 提供 一 种 方法 将 这 些 树 整 合成 一 棵 更 大 的 树 。 图 4. 13 表示 了 这 个 方法 。 


用 户 角 度 : 一 棵 树 “系统 角度 : MN 





图 4.13 树 的 嫁接 


图 4. 13 中 用 户 看 到 的 是 一 棵 完好 的 目录 树 ,但 是 实际 上 有 两 棵 树 , 一 个 在 磁盘 1 上 ,一 
个 在 磁盘 2 上 。 每 棵 树 都 有 一 个 根 目录 。 一 个 文件 系统 被 命名 为 根 文件 系统 ,这 棵 树 的 顶端 
是 整 棵 树 的 真正 的 根 ; 另 一 个 文件 系统 则 被 附加 到 根 文 件 系统 的 某 个 子 目录 上 。 在 内 部 ,内 
核 在 根 文件 系统 将 一 个 目录 作为 指针 ,指向 另 一 个 文件 系统 的 根 ,这 样 两 个 文件 系统 就 联系 
起 来 了 。 


4.6.1 装载 点 


在 Unix 中 ,装载 文件 系统 (to mount a file system) 是 指 将 它 骨 入 到 已 有 的 系统 以 获得 
东 些 支持 , 子 树 的 根 目录 被 工人 到 根 文件 系统 的 一 个 目录 中 , 子 树 所 在 的 目录 被 称 做 第 二 个 
系统 的 装载 点 (mount point), 

命令 mount 列 出 当前 所 装载 的 文件 系统 以 及 它们 的 装载 点 : 


S mount 

/dev/hdal on / type ext2 (rw) 

/ dev/hda6 on /home type ext2 (rw) 

none on /proc type proc (rw) 

none on /dev/pts type devpts (rw, mode - 0620) 
$ 


输出 的 第 一 行 表 明 /dev/hda 上 的 分 区 1( 第 一 个 IDE 设备 ) 被 装载 在 树 的 根 目 录 上 。 这 
个 分 区 是 根 文件 系统 。 输 出 的 第 二 行 表 明 dev/hda6 上 的 文件 系统 被 装载 在 根 文件 系统 的 / 
home 目录 上 。 因 此 , 当 用 户 使 用 chdir 从 “/” 进入 “/home” 时 ,实际 上 是 从 一 个 文件 系统 进 
入 了 本 万 一 个 文件 系统 。 当 该 pwd 沿 树 向 上 回 湖 时 , 它 就 会 停 在 /home， 因为 它 到 达 了 该 文件 
系统 的 顶端 。 
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Unix 允许 不 同类 型 的 文件 系统 被 装载 在 根 文件 系统 。 例 如 ,一 个 含有 ISO 9660 文件 系 
统 的 CD-ROM 能 够 被 装载 在 一 个 Unix 机 器 上 ,并 且 盘 上 的 目录 和 文件 将 会 成 为 树 的 一 部 
分 。 如 果 内 核 包 含 知道 如 何 与 Macintosh 文件 系统 协同 工作 的 驱动 程序 ,那么 一 个 含有 
Macintosh 文件 系统 的 磁盘 就 能 够 被 装载 。 其 至 ,通过 网 络 连接 的 其 他 的 计算 机 上 的 文件 系 
统 也 能 够 被 装载 。 


4.6.2 多 重 i- 节 点 号 和 设备 交叉 链接 


将 不 同 的 文件 系统 合成 一 棵 树 有 很 多 优点 ,当然 也 有 小 问题 。 在 Unix 中 ,每 个 文件 都 
有 一 个 i- 节点 号 。 就 像 两 条 不 同 的 街道 都 有 一 个 门牌 号 为 402 的 房子 一 样 ,两 个 不 同 的 磁 
盘 可 能 都 含有 i- 节点 号 为 402 的 文件 。 若 于 个 目录 可 能 都 含有 i- 节 点 号 为 402 的 文件 ,内 
核 是 如 何 知道 应 该 使 用 哪个 402 的 i- 节 点 呢 ? 

仔细 观察 图 4. 14 中 被 圈 出 来 的 两 个 目录 ,一 个 在 根 文件 系统 ,一 个 在 被 装载 的 文件 系 
统 。 每 个 目录 都 包含 一 个 i- 节点 402 的 链接 。myls. c 和 y. old 似乎 为 指向 同一 个 i- 节 点 的 
两 个 链接 ,但 是 那个 i- 节点 在 哪 呢 ? 磁盘 1 上 的 文件 系统 有 一 个 i- 节 点 402, 磁 盘 2 上 的 文 
件 系统 有 一 个 不 同 的 i- 节 点 402。 这 两 个 链接 根本 不 指向 同一 个 文件 。 







= (30 p yold — 
| 









mount point 
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这 个 例子 列举 了 一 个 由 树 连 接 成 树 的 一 个 问题 , 即 一 个 i- 节 点 号 并 不 惟一 地 标识 一 个 
文件 了 。 就 像 刚 刚 看 到 的 那样 ,相同 的 i- 节 点 号 402 出 现在 两 个 不 同 的 目录 中 , 却 指 向 2 个 
不 同 的 文件 。 看 起 来 这 两 个 链接 指向 同一 个 文件 ,但 实际 上 却 不 是 。 

如 何 从 不 同 的 文件 系统 生成 指向 同一 个 文件 的 链接 ? 这 一 点 是 无 法 做 到 的 ,文件 以 数 
据 块 的 集合 和 一 个 i- 节 点 的 形式 出 现在 磁盘 上 ,目录 中 的 链接 会 指向 那个 i- 节点 。 如 果 一 
个 磁盘 上 的 链接 指向 另 一 个 磁盘 上 的 i- 节 点 将 会 发 生 什 么 事 ? 如 果 另 一 个 磁盘 未 被 装载 ， 
文件 则 会 不 存在 。 更 糟糕 的 是 ,如 果 一 个 存储 着 拥有 i- 节 点 402 的 不 同文 件 的 不 同 磁 盘 被 
装载 , 则 文件 的 内 容 就 完全 不 同 了 。 你 也 可 以 想到 其 他 麻烦 的 情况 。 

link 和 rename 系统 调用 知道 这 种 情况 吗 ? 知道 。link 拒绝 创建 跨越 设备 的 链接 ， 
rename 拒绝 在 不 同 的 文件 系统 间 进 行 i- 节点 号 的 转移 。 阅 读 手册 可 以 了 解 它 们 所 返回 的 
错误 代码 。 
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4.6.3 符号 链接 


硬 链接 (hard links) 是 将 目录 链接 到 树 的 指针 , 硬 链 接 同 时 也 是 将 文件 名 和 文件 本 身 链 
接 起 来 的 指针 。 

硬 链接 不 能 指向 其 他 系统 中 的 i- 节 点 ,即使 根 也 不 能 生成 到 目录 的 链接 。 也 许 有 支持 
这 种 跨 系 统 链接 的 理由 ,但 Unix 支持 另 一 种 形式 的 链接 : 符号 链接 。 符 号 链接 通过 名 字 引 
用 文件 ,而 不 是 i- 节 点 号 。 以 下 是 它们 的 比较 : 


$ who > whoson 

$ ln whoson ulist 

$ ls — li whoson ulist 

377 -rw-r--r-- 2 bruce users 235 Jul 16 09.42 ulist 
377  -rw-r--r-- 2 bruce users 235 Jul 16 09:42 whoson 
$ ln - s whoson users 


$ ls - li whoson ulist users 


377  -rw-r-r-- 2 bruce users 235 Jul 16 09.42 ulist 
289 lrwxrwxrwx 1 bruce users 6 Jul 16 09.43 users -> whoson 
377  -rw-r-r--— 2 bruce users 235 Jul 16 09.42 Whoson 


文件 whoson 和 ulist 是 指向 同一 个 文件 的 链接 。 两 个 都 拥有 i- 节 点 号 377, 都 有 同样 的 
文件 大 小 .修改 时 间 和 链接 数 。 通 过 命令 ln 创建 硬 链 接 ulist。 

男 一 方面 ,命令 ln -s 生成 文件 whoson 的 一 个 符号 链接 ,并 把 这 个 新 链接 称 为 users, 
ls -1 显示 users 拥有 i- 节点 289。 字 母 1 在 文件 类 型 点 处 表明 users 是 一 个 符号 链接 。 链 
接 数 修改 时 间 和 文件 大 小 都 不 同 于 原始 文件 。 文 件 users 并 不 是 原始 文件 whoson, 但 是 当 
程序 对 它 进 行 读 写 时 , 它 就 像 原始 文件 一 样 。 例 如 : 


$ wc - 1 whoson users 
5 whoson 
5 users 
10 total 
$ diff whoson users 


$ 


命令 we 和 diff 分 别 用 于 对 文件 计算 行 数 和 比较 内 容 。 在 这 种 情况 下 ,内 核 使 用 名 字 找 
到 原始 文件 。 另 一 方面 ,对 函数 stat 的 调用 返回 关于 链接 的 信息 , 而 不 是 关于 原始 文件 了 的。 

符号 链接 可 能 跨越 文件 系统 ,因为 它们 并 不 存储 原始 文件 的 i- 节 点。 符号 链接 也 可 以 
指 癌 目 录 , 因 为 它们 与 将 文件 系统 联系 在 一 起 的 真正 的 链接 不 同 。 

在 交叉 设备 链接 的 情况 中 符号 链接 也 存在 前 面 所 讨论 的 问题 ,如 果 保 存 原始 文件 的 文 
件 系统 被 删除 了 ,或 者 原始 文件 有 了 新 的 文件 名 ,符号 链接 都 将 指向 空 。 如 果 一 个 拥有 相同 


中 系统 调用 lstat 返回 链接 所 指向 的 文件 的 信息 。 
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名 字 的 文件 被 加 载 了 ,符号 链接 则 将 指向 不 同 的 文件 。 指 癌 目 录 的 符号 链接 可 以 指 癌 父 目 
录 , 因 此 在 目录 树 中 产生 循环 套 。 符 号 链接 可 以 将 你 的 文件 系统 彻底 搞 乱 ,但 是 内 核 知道 这 
些 仅 是 符号 链接 ,而 不 是 真正 的 链接 ,所 以 能 够 检查 丢失 的 引用 和 死 循环 。 

系统 调用 symlink 用 于 创建 一 个 符号 链接 。 系 统 调 用 readlink 用 于 获取 原始 文件 的 名 
Fo lstat 用 于 获取 原始 文件 的 信息 。 阅 读 联机 帮助 可 以 了 解 unlink, link 和 符号 链接 是 如 
何 作 用 的 。 


小 gi 


l. 主要 内 容 
* Unix 将 存储 在 磁盘 中 的 数据 组 织 成 文件 系统 。 文 件 系 统 是 文件 和 目录 的 集合 。 目 
录 是 名 字 和 指针 的 列表 。 目 录 中 的 每 一 个 入 口 指向 一 个 文件 或 目录 。 目 录 包 含 指 向 
父 目 录 和 子 目 录 的 入 口 。 
Unix 文件 系统 包含 3 个 主要 部 分 : 超级 块 i- 节点 表 和 数据 区 域 。 文件 内 容 存 储 在 
数据 块 。 文 件 属性 存储 在 i- 节点 。 表 中 i- 节点 的 位 置 称 为 文件 的 i- 节点 号 。i-- 节 
点 号 是 文件 的 惟一 标识 。 
”相同 的 1- 节点 号 可 能 以 不 同 的 名 字 在 若干 个 目录 中 出 现 。 每 个 人 口 被 称 为 指向 文 
件 的 硬 链 接 。 符 号 链接 是 通过 文件 名 引用 文件 ,而 不 是 i- 节 点 号 。 
大 十 个 文件 系统 的 目录 树 可 被 整合 成 一 棵 树 。 内 核 将 一 个 文件 系统 的 目录 链接 到 另 
一 个 文件 系统 的 根 的 操作 称 为 装载 。 | 
Unix BE E T RP AR Ge val FA. 允许 程序 员 进 行 创 建 和 删除 目录 、 复 制 指针 、 删 除 指针 、 
改变 连接 和 分 离 其 他 文件 系统 等 的 操作 。 

2. 图 示 

目录 入 口 是 文 件 名 和 i- 节点 号 组 成 的 对 。i- 节 点 号 指向 磁盘 上 的 一 个 结构 ,该 结构 包 
含 文件 信息 和 数据 块 的 分 配 , 如 图 4. 15 所 示 。 





图 4.15 i- 节 点 、 数 据 块 .目录 、 指 针 
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3. 下 一 章 的 内 容 

文件 只 是 一 种 类 型 的 数据 源 。 程 序 也 可 处 理 来 自 于 像 终 端 . 数 码 相 机 .扫描 仪 等 设备 的 
数据 。Unix 程序 如 何 从 设备 读 取 数据 和 发 送 数据 呢 ? 

4. 习题 


4. 


4. 2 


4. 3 


4.4 


4. 5 


4. 6 


pwd 显示 文件 系统 中 到 达 当 前 目录 的 路 径 。 从 某 种 意义 上 说 ,那个 目录 是 在 树 中 
所 处 的 位 置 。 实 际 上 该 目录 是 一 些 字 节 的 集合 ,而 这 个 集合 存储 在 磁盘 上 的 某 个 
WE ,该 位 置 能 以 柱 面 、 磁 头 、. 扇 区 和 字 节 的 方式 定位 。 有 办 法 将 当前 工作 目录 转 
换 成 这 些 人 硬件 位 置 吗 ? 


看 一 下 所 使 用 的 系统 中 的 一 个 硬盘 。 找 出 它 有 多 少 个 分 区 ,确定 每 个 分 区 的 i- 节 
点 的 个 数 和 数据 块 的 个 数 。 


Unix 不 仅仅 是 在 内 部 使 用 将 磁盘 抽象 成 序列 的 方法 创建 文件 系统 ,而且 它 使 得 这 
个 抽象 方法 适用 于 任何 拥有 合法 权限 的 用 户 。 要 做 这 个 实验 ,需要 有 最 高 权限 ， 
即 管理 员 权 限 。 

/dev 目录 包含 允许 你 从 磁盘 块 中 读 取 字 节 的 设备 描述 文件 ,从 设备 读数 据 的 时 候 
可 以 认为 数据 就 在 这 些 文件 中 。 在 一 个 装 有 IDE 设备 的 Linux 系统 上 ,可 以 看 到 
Wii / dev/hda,/dev/hdb,dev/hdc,/dev/hdd 的 文件 。 这 些 设 备 文件 不 是 像 /etc/ 
passwd 或 /var/adm/utmp 这 样 的 常规 数据 文件 。 这 些 数据 文件 提供 对 磁盘 上 原 
始 数 据 的 访问 ,而且 可 以 使 用 cat, more, cp 和 其 他 的 命令 来 读 取 磁盘 上 的 内 容 。 
就 像 文件 utmp 一 样 ,磁盘 有 一 个 清晰 的 结构 。 一 块 接 一 块 地 查看 磁盘 内 容 的 一 
种 方法 是 使 用 命令 od -c/dev/hda | more。 当 查看 该 命令 的 输出 时 ,就 会 觉得 磁 
盘 是 一 个 顺序 的 .连续 的 磁盘 块 一 样 。 每 个 分 区 都 由 其 中 的 一 个 特定 文件 表示 。 


例如 ,/dev/hda 上 的 第 一 个 分 区 被 称 为 /dev/hdal 。 


查看 系统 中 的 /dev 目录 , 找 出 对 应 于 系统 上 硬盘 驱动 .软盘 驱动 .CD-ROM 驱动 
和 其 他 磁盘 驱动 的 特定 文件 。 


本 章 中 提 到 内 核 在 新 建 一 个 文件 时 需要 找到 一 个 空 的 i- 节 点 和 空 的 磁盘 块 。 内 
核 如 何 知道 哪些 磁盘 块 是 空 的 ? 哪些 i- 节 点 是 空 的 ? 你 机 器 上 的 文件 系统 使 用 
什么 方法 跟踪 那些 未 被 使 用 的 磁盘 块 和 ii- 节点 呢 ? 


Unix 能 够 读 取 和 装载 包含 非 Unix 文件 系统 的 磁盘 , 像 PC-DOS 和 Macintosh fif 
盘 。 在 内 部 ,这 些 系 统 没有 i- 节 点。 虽然 如 此 , 当 使 用 命令 mount 将 其 中 一 个 磁 


查看 Linux 源 代 码 以 确定 这 些 编号 从 何 处 来 。Linux 为 何 添加 它们 ? 


本 章 中 通过 描述 包含 10 个 直接 块 .1 个 间接 块 .1 个 二 级 间接 块 和 1 个 三 级 间接 块 

的 i- 节点 解释 了 分 配 列 表 。 有 些 Unix 版 本 使 用 不 同 的 编号 。 

(1) 你 所 使 用 的 系统 上 的 -节点 分 配 列表 的 格式 是 怎样 的 ? 头 文件 应 该 包含 这 
些 详细 内 容 。 
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(2) 你 系统 上 的 一 个 数据 块 的 大 小 是 多 少 ? 

(3) 在 你 的 系统 上 ,不 使 用 间接 块 的 最 大 文件 是 什么 ? 

(4) 在 你 的 系统 上 ,不 使 用 二 级 间接 块 的 最 大 文件 是 什么 ? 最 大 的 文件 实际 上 用 
了 多 少 个 块 ? 


一 个 文件 可 能 有 多 个 链接 。 链 接 计数 器 记录 了 文件 的 链接 个 数 。 那 么 目录 如 何 
呢 ? 在 你 自己 的 demodir 树 中 ,使 用 1s -1 找 出 每 个 目录 的 链接 数 。 将 这 些 链 接 数 
和 图 表 上 的 箭头 相 比较 。 解 释 目 录 链 接 数 的 意思 。 为 什么 每 个 目录 的 链接 数 至 
少 为 2? | 


没有 人 能 够 使 用 ink 生成 到 目录 的 新 链接 。 在 过 去 ,超级 用 户 有 权 生 成 到 目录 的 
硬 链接 。 在 demodir 的 例子 中 ,观测 在 用 户 视 图 和 系统 视图 中 添加 系统 调用 link 
("demodir/c", "demodir/d2/e") 执 行 后 所 产生 的 效果 。 然 后 解释 命令 ls -iaR 
demodir 将 产生 什么 结果 。 


当 使 用 mount 命令 将 一 个 文件 系统 装载 到 另 一 个 文件 系统 ,装载 点 必须 是 原 有 文 
件 系 统 的 一 个 目录 。 考 虑 将 /dev/hda4 上 的 文件 系统 连接 到 /home2 这 个 目录 上 
的 情况 ,思考 以 下 两 个 问题 : CD 如果/home2 这 个 装载 点 不 存在 将 产生 什么 结果 ? 
《2) 如 采 装 载 点 存在 , 且 包含 文件 和 子 目录 ,将 产生 什么 结果 ? 


命令 rmdir 不 删除 含有 文件 或 子 目 录 的 目录 。 为 什么 要 这 么 做 ? 

为 一 方面 ,可 以 删除 含有 用 户 的 目录 。 尝 试 以 下 的 操作 : 生成 一 个 由 自己 命名 的 
新 目录 并 进入 这 个 目录 ,然后 开启 另 一 个 命令 窗口 ,删除 这 个 新 目录 。 关 闭 第 二 
个 命令 窗口 ,输入 命令 /bin/pwd, 看 看 将 产生 什么 。 


硬盘 上 的 柱 面 (cylinder) 是 什么 意思 ? 硬盘 的 物理 构造 是 什么 使 得 柱 面 这 个 概念 
对 有 效 利 用 磁盘 如 此 重要 ? 在 网 上 查找 柱 面 组 (cylinder group) 这 个 概念 。 解 释 
这 个 概念 和 本 章 中 文件 系统 模型 之 间 的 联系 。 


“很 多 人 都 了 解 磁 盘 空间 不 足 这 个 概念 。 一 个 Unix 文件 系统 有 一 个 1- 节点 区 域 


和 一 个 数据 区 域 。 因 此 ,即使 数据 区 有 空间 ,i- 节 点 空间 也 有 可 能 不 足 。 当 在 
Unix 上 安装 了 一 个 新 的 磁盘 ,需要 将 磁盘 分 成 i- 节 点 表 和 数据 区 。 文 件 系统 上 
的 每 个 文件 都 需要 一 个 i- 节 点 。i- 节 点 表 越 大 , 留 给 文件 内 容 的 空间 越 小。 
假设 要 安装 一 个 新 的 硬盘 。 命 令 mkfs 生成 一 个 新 的 文件 系统 并 且 让 你 确定 i- 
节点 表 的 大 小 。 阅 读 联机 帮助 以 了 解 这 个 命令 。 为 什么 需要 大 量 的 i- 节 点 ? 为 
什么 有 时 候 又 比 常规 需要 的 少 ? 


系统 调用 stat 接受 文件 名 和 指向 结构 的 指针 ,并 且 将 文件 信息 填充 到 该 结构 中 。 
解释 stat 是 如 何 通 过 使 用 目录 、i- 节 点 和 数据 模型 来 完成 该 功能 的 、 它 是 从 哪 
里 找到 数据 并 将 数据 复制 到 stat 结构 中 的 呢 ? 
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5.. 编程 练习 


4. 14 


4. 15 


4. 16 


4. 20 


6. 项 目 


编写 一 个 创建 整个 demodir Ho BER Unix 命令 。 
Unix 命令 mkdir 接受 选项 -p。 编 写 一 种 文 持 这 个 选项 的 mkdir 命令 版 本 。 


命令 mv 不 仅仅 调用 系统 调用 rename。 编 写 一 种 接受 两 个 参数 的 mv 版 本 。 第 
一 个 参数 必须 是 文件 名 ,第 二 个 参数 是 文件 名 或 目录 名 。 如 果 目 标 是 个 目录 和 名， 
则 mv 将 文件 移动 到 那个 目录 。 和 否则 ,如果 可 能 的 话 ,mrv 将 重 命名 这 个 文件 。 


本 章 中 提供 了 一 种 使 用 link 和 unlink 编写 的 rename 版 本 。 该 代码 片断 检验 
link 的 返回 值 , 但 是 并 未 检验 unlink 的 返回 值 。 扩 充 该 段 代 码 , 使 得 它 能 够 正确 
处 理 unlink 的 错误 信息 。 


阅读 联机 帮助 和 头 文 件 以 了 解 系统 上 的 超级 块 的 结构 。 编 写 一 个 能 够 打开 文件 
系统 .阅读 超级 块 和 以 清晰 可 读 的 格式 显示 文件 系统 设置 的 程序 。 这 个 练习 与 
显示 utmp 记录 内 容 和 stat 结构 的 程序 类 似 。 


对 新 建 一 个 文件 的 解释 列 出 了 4 个 主要 的 操作 。4 个 操作 必须 完全 正确 才能 使 

文件 能 够 被 正确 添加 到 文件 系统 。 如 果 计 算 机 在 这 一 系列 的 操作 中 突然 掉 电 将 

会 发 生 什 么 情况 ?例如 ,如 果 数 据 被 存储 在 了 数据 区 ,而 i- 节点 还 未 被 分 配 , 将 

发 生 什么 事 ? 

(OD 为 这 4 个 操作 选择 一 种 顺序 ,并 加 以 解释 。 

(2) 现在 假设 一 个 系统 按照 (1) 的 答案 被 创建 ,如 果 系 统 在 这 个 过 程 中 突然 崩溃 
READ? 例如 ,你 的 过 程 有 4 个 步骤 .3 个 中 间 点 ,在 每 个 点 的 崩 演 将 会 导 
致 文件 系统 的 哪些 不 一 致 性 呢 ? 

(3) 阅读 Unix 命令 fsck。 看 看 (2) 的 答案 和 fsck 寻找 的 内 容 有 多 少 是 接近 的 。 


在 第 3 章 中 编写 了 ls -1 的 一 个 版 本 。 修 改 那个 程序 ,使 得 它 不 仅 能 够 显示 原先 
的 信息 ,还 能 显示 i- 节 点 号 。 另 外 ,你 的 新 版 本 的 ls 是 从 哪里 找到 i- 节 点 号 的 ? 


基于 本 章 的 内 容 ,你 能 够 了 解 和 编写 以 下 这 些 Unix 程序 : 


find,du,is —-R,mount,dump 











概念 与 技巧 

© 文件 和 设备 间 的 相似 之 处 
。 文件 和 设备 间 的 不 同 之 处 
。 连接 的 属性 

。 竞争 和 原子 操作 

。 控制 设备 驱动 程序 

。 ji 

相关 的 系统 调用 

e fentl ioctl 

* tcsetattr,tcgetattr 

相关 命令 

e stty 


e write 
5.1 为 设备 编程 


前 面 章节 中 已 经 讲述 了 一 些 与 文件 和 目录 相关 的 程序 。 计 算 机 还 有 其 他 的 数据 来 源 ， 
如 调制 解 调 器 .打印 机 扫描 仪 .鼠标 .扬声器 .照相 机 和 终端 等 这 样 的 外 部 设备 。 在 本 章 中 
将 学 习 这 些 设 备 与 目录 和 文件 的 相似 之 处 和 不 同 之 处 ,并 了 解 如 何 将 这 些 想法 用 于 管理 设 
备 间 的 连接 。 | 

本 章 的 项 目 是 编写 命令 stty 的 另外 一 个 版 本 。stty 用 来 让 用 户 检测 .修改 控制 键盘 和 
显示 融 连 接 属 性 的 设置 。 


5.2 设备 就 像 文 件 


很 多 人 认为 文件 是 一 些 存储 在 磁盘 上 的 数据 ,但 是 Unix 采用 一 种 更 抽象 的 方法 。 首 先 
考虑 文件 的 实际 情形 : 文件 包含 数据 ,具有 属性 ,通过 目录 中 的 名 字 被 标识 。 可 以 从 一 个 文 
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件 读 取 数据 ,也 可 以 向 一 个 文件 写 人 数据 。 现 在 请 注意 ,这 种 方法 将 被 应 用 于 设备 。 

考虑 一 块 连接 到 麦克 风 和 扬声器 的 声卡 。 你 对 着 麦克 风 说 话 , 声 卡 将 来 自 你 声音 的 信 
号 转换 成 数据 流 ,使 得 程序 能 够 读 取 这 个 数据 流 。 当 程序 向 声卡 写 人 数据 流 时 ,声音 就 从 扬 
声 器 中 出 来 。 对 一 个 程序 来 说 ,声卡 既是 数据 的 源 ,又 是 数据 的 目的 地 。 

一 个 市 有 键盘 和 显示 器 的 终端 也 和 文件 类 似 。 键 盘 输入 就 像 数 据 一 样 能 够 被 程序 读 
取 ,而 一 个 进程 把 写 人 终端 的 字符 显示 在 屏幕 上 。 

对 Unix 来 说 ,声卡 .终端 .鼠标 和 磁盘 文件 是 同一 种 对 象 。 在 Unix 系统 中 ,每 个 设备 都 
被 当做 一 个 文件 。 每 个 设备 都 有 一 个 文件 名 ,一 个 i- 节点 号 ,一 个 文件 所 有 者 、 一 个 权限 位 
的 集合 和 最 近 修 改 时 间 。 你 所 了 解 的 和 文件 有 关 的 所 有 内 容 都 将 被 运用 于 终端 和 其 他 的 
设备 。 | 


5.2.1 设备 具有 文件 名 


每 个 加 载 到 Unix 机 器 的 设备 (终端 .打印 机 、 鼠 标 、 磁 盘 等 ) 都 通过 文件 名 表示 。 通 常 ， 
表示 设备 的 文件 存放 在 目录 /dev 中 ,但 是 可 以 在 任何 目录 中 创建 设备 文件 。 请 查看 不 同 
Unix Paf E WY /dev 目录 。 以 下 是 我 所 使 用 的 机 器 上 的 部 分 列表 : 


$ ls -C /dev | head -5 


XOR fdlu720 loopl ptyqf sda7 stderr ttysd . 
agpgart fdlu800 1p0 ptyr0 sda8 stdin ttyse 
apm bios  fdlu820 ipl ptyrl sda9 stdout ttysf 
arcd fdlu830 lp2 ptyr2 sdb tape ttyto 
dsp flashO mcd ptyr3 sdbi tcp ttytl 


这 个 列表 显示 了 和 若干 种 设备 。 第 三 列 中 的 lp * 文件 是 打印 机 。 第 二 列 中 的 fd x 文件 是 
VOR. sd» 文件 是 SCSI 设备 的 分 区 ,/dev/tape 是 磁带 备份 驱动 程序 的 设备 文件 。 最 后 一 
列 中 的 tty* 文件 是 终端 。 程 序 通 过 读 取 这 些 文件 获得 用 户 的 键盘 输入 ,通过 写 人 这 些 文件 
向 终端 屏幕 发 送 数据 。 | 

dsp 文件 是 到 声卡 的 一 个 连接 。 进 程 通过 向 该 设备 文件 写 人 字 节 来 运行 一 个 声音 文件 。 
进程 可 以 通过 打开 文件 /dev/mouse 来 读 取 鼠标 的 单 击 和 位 置 的 变化 。 


5.2.2 设备 和 系统 调用 
设备 不 仅 具 有 文件 名 ,而 且 支 持 与 所 有 文件 相关 的 系统 调用 ， open,read, write,lseek, 


close 和 stat, 


例如 ,从 磁带 读 取 数据 的 代码 如 下 : 

int fd; 

fd = open ("/dev/tape",0 RDONLY); /* connect to tape drive x/ 
lseek (fd, (long)4096, SEEK SET); /* fast forward 4096 bytesx/ 
n = read (fd, buf, buflen); /* xead data from tape x/ 


close (fd); | /* disconnect x/ 
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和 磁盘 文件 相关 的 系统 调用 同样 可 以 为 其 他 设备 服务 。 实 际 上 ,Unix 没有 其 他 的 方法 
用 来 和 设备 通信 。 

当 你 移动 鼠标 并 按键 ,鼠标 将 数据 发 送 到 系统 ,使 得 进程 能 够 读 取 它 们 。 向 设备 写 人 数 
据 意 味 着 什么 呢 ? 发 送 数 据 到 鼠标 ,不 会 使 鼠标 移动 ,也 不 会 使 鼠标 的 键 被 按 下 。 
/dev/mouse 文 件 不 支持 所 有 的 write 系统 调用 。 当 然 , 可 以 制造 带 有 发 动机 的 鼠标 ,然后 编 
写 一 个 更 高 级 的 鼠标 驱动 程序 ,使 得 系统 能 够 接受 并 产生 鼠标 事件 。 

终端 支持 read 和 write, {HA WHF lseek。 考 虑 一 下 这 是 为 什么 呢 ? 


5.2.3 例子 : 终端 就 像 文 件 


Unix 的 很 多 用 户 输入 来 自 终 端 。ttysd ,ttyse 等 文件 都 代表 终端 。 按 传统 定义 终端 是 键 
盘 和 显示 单元 ,但 实际 可 能 包括 一 个 20 世纪 70 年 代 生 产 的 打印 机 、 一 个 键盘 和 一 个 串 行 接 
口 的 显示 器 ,或 是 一 个 调制 解 调 器 和 通过 拨号 上 网 的 软件 。 在 因特网 登录 的 telnet 或 ssh Bf 
口 也 可 以 认为 是 一 个 终端 。 终 端 最 重要 的 功能 是 接受 来 自用 户 的 字符 输入 和 将 输出 信息 显 
示 给 用 户 。 显 示 输 出 单元 甚至 可 以 产生 盲文 打印 或 声音 。 

命令 tty 用 来 告知 用 户 所 在 终端 的 文件 名 。 用 终端 文件 做 以 下 试验 : 


$ tty 
/dev/pts/2 
$ cp /etc/motd /dev/pts/2 
Today is Monday, we are running low on disk space. Please delete files. 
- your sysadmin 
$ who > /dev/pts/2 
bruce  pts/2 Jul 17 23;35 (ice. northpole. org) 
bruce  pts/3 Jul 18 02;03 (snow. northpole. org) 
$ ls - li /dev/pts/2 
4  crw--w--w- 1 bruce tty 136, 2 Jul 18 03:25 /dev/pts/2 


从 以 上 输出 可 以 知道 ,终端 tty 对 应 的 设备 描述 文件 名 为 /dev/pts/2。 可 以 对 该 文件 使 
用 任何 与 文件 相关 的 命令 和 进行 任何 文件 操作 ,如 ep ERE AE“ >” mv, In rm, cat 或 ls 等 
各 种 命令 。 

命令 cp 从 普通 文件 /etc/motd 中 读 取 数据 ,向 设备 文件 /dev/pts/2 写 人 数据 ,使 得 内 
容 能 够 显示 在 屏幕 上 。 写 人 设备 文件 就 是 向 设备 写 人 字 节 ,例子 中 的 下 一 行 表明 将 带 有 
EER "BJ who 的 输出 内 容 发 送 到 /dev/pts/2, 并 将 数据 以 字符 的 形式 显示 在 屏 
PEO, 


5.2.4 设备 文件 的 属性 
设备 文件 具有 磁盘 文件 的 大 部 分 属性 。 上 面 ls 的 输出 内 容 表 明 /dev/pts/2 拥有 ji- 节 点 
4, 权 限 位 为 rw--w--w- ,1 个 链接 ,文件 所 有 者 bruce 和 组 tty, 最 近 修 改 时 间 是 Jul 18 at 


D 这 有 点 像 言 人 用 的 点 字 法 ， 
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03:25。 文 件 类 型 是 “c”, 表 示 这 个 文件 实际 上 是 以 字符 为 单位 进行 传送 的 设备 。 权 限 位 看 起 
来 有 点 奇怪 ,表达 式 136,2 显示 在 表示 文件 大 小 的 地 方 , 它 有 什么 特殊 的 含义 呢 ? 

(1) 设备 文件 和 文件 大 小 

常用 的 磁盘 文件 由 字 节 组 成 ,磁盘 文件 中 的 字 节 数 就 是 文件 的 大 小 。 设 备 文件 是 链接 ， 
而 不 是 容器 。 键 盘 和 鼠标 不 存储 击 键 数 和 点 击 数 。 设 备 文件 的 i- 节 点 存储 的 是 指向 内 核子 
程序 的 指针 ,而 不 是 文件 的 大 小 和 存储 列表 。 内 核 中 传输 设备 数据 的 子 程序 被 称 为 设备 驱 
动 程序 。 

在 /dev/pts/2 这 个 例子 中 ,从 终端 进行 数据 传输 的 代码 是 在 设备 一 进程 表 中 编号 为 136 
的 子 程序 。 该 子 程序 接受 一 个 整 型 参数 。 在 /dev/pts/2 中 ,参数 是 2。136 和 2 这 两 个 数 被 
称 为 设备 的 主 设备 号 和 从 设备 号 。 主 设备 号 确定 处 理 该 设备 实际 的 子 程序 ,而 从 设备 号 被 
”作为 参数 传输 到 该 子 程序 。 

(2) 设备 文件 和 权限 位 

每 个 文件 都 有 相应 的 读 、 写 和 执行 的 权限 。 当 文件 实际 上 表示 设备 时 ,权限 位 表示 什么 
意思 呢 ? 向 文件 写 人 数据 就 是 把 数据 发 送 到 设备 ,因此 ,权限 写意 味 着 允许 向 设备 发 送 数 
据 。 在 这 个 例子 中 ,文件 所 有 者 和 组 tty 的 成 员 拥 有 写 设备 的 权限 ,但 是 只 有 文件 的 所 有 者 
有 谈 取 设备 的 权限 。 读 取 设 备 文件 就 像 读 取 普 通 文件 一 样 ,从 文件 获得 数据 。 如 果 除 了 文 
件 所 有 者 还 有 其 他 用 户 能 够 读 取 /dev/pts/2， 那么 其 他 人 也 能 够 读 取 在 该 键盘 上 输入 的 字 
符 , 读 取 其 他 人 的 终端 输入 会 引起 某 些 麻 烦 。 

另 一 方面 ,向 其 他 人 的 终端 写 人 字符 是 Unix 中 write 命令 的 目标 。 


5.2.5 编写 write 程序 


在 即时 消息 和 聊天 室 出 现 之 前 , Unix 用 户 通过 使 用 命令 write 和 在 其 他 终端 上 的 用 户 
聊天 : 


$ man 1 write 
WRITE(1) Linux Programmer 's Mannual WRITE(1) 
Name 
write — send a message to another user 
SYNOPSIS 
write user [ttyname | 
DESCRIPTION 
Write allows you to communicate with other users by copying lines from you terminal to 
theirs. 
When you run the write command, the user you are writing to gets a message of the form: 


Message from yourname@ yourhost on yourtty at hh :mm 


Any further lines you enter will be copied to the Specified user's terminal. If the other user 
wants to reply, they must run write as well. 
When you are done, type an end- of - file or interrupt character. The other user will see the 


message EOF indicating that the conversation is over. 
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以 下 这 个 简单 的 write 版 本 仅 发 送 消 息 内 容 ,而 不 发 送 “Message from... > 这些 提示 信 
息 , 并 且 需 要 的 参数 是 终端 的 文件 名 (ttyname) ,而 不 是 其 他 人 的 用 户 名 ， 


/x writed.c 
关 
* purpose; send messages to another terminal 
* method: open the other terminal for output then 
x copy from stdin to that terminal 
* shows; a terminal is just a file supporting regular i/o 
x usage: writeO ttyname 
x/ 
# include « stdio. h> 
# include <fentl. h> 
main( int ac, char «av[]) 
( 
int fd; 
char buf[ BUFSIZ ] ; 
/* check args x/ 
if (ac I= 2 ){ 
fprintf(stderr, "usage; write0 ttyname\n") ; 
exit(1); 
! 
/* open devices x/ 
fd = open( av[1], O WRONLY ); 
if (fd == -1)¢ . 
perror(av[1]); exit(1); 
} 
/* loop until EOF on input */ 
while( fgets(buf, BUFSIZ, stdin) != NULL ) 
if ( write(fd, buf, strlen(buf)) == -1) 
break; 
close( fd); 
) 


仔细 阅读 这 段 代 码 , 在 这 里 找 不 到 键盘 连接 到 其 他 用 户 屏 幕 所 需 的 特殊 特征 。 这 个 简 
单 的 write 程序 将 一 个 文件 的 内 容 一 行 行 地 复制 到 另 一 个 文件 。 这 个 例 程 和 前 面 章 节 中 的 
例子 表明 终端 就 像 其 他 连接 到 Unix 机 器 的 设备 一 样 ,能 够 以 磁盘 文件 的 方式 被 处 理 。 


5.2.6 设备 文件 和 ji- 节 点 


这 些 设备 文件 是 如 何 工作 的 呢 ? Unix 文件 系统 的 i- 节 点 和 数据 块 是 如 何 支持 设备 文 
件 这 个 概念 的 ? 图 5. 1 显示 了 它们 之 间 的 关系 。 

目录 是 文件 名 和 i- 节点 号 的 列表 。 目 录 并 不 能 区 分 哪些 文件 名 代表 磁盘 文件 ,哪些 文 
件 名 代表 设备 。 文 件 类 型 的 区 别 体现 在 i- 节点 上 ， 
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PE 

i- 节点 A SOM 设备 文件 的 i- 节点 包含 IE 

一 个 指向 数 mm 一 个 指向 内 核 中 设备 驱 E 
据 块 的 指针 | 动 器 的 指针 。 


图 5.1 指向 数据 块 或 驱动 器 的 i- 节点 


每 个 i- 节 点 编号 指向 i- 节 点 表 中 的 一 个 结构 。 i 一 方 点 可 以 是 磁盘 文件 的 ,也 可 以 是 设 
备 文件 的 。i- 节 点 的 类 型 被 记录 在 结构 stat 的 成 员 变 量 st mode 的 类 型 区 域 中 。 

磁盘 文件 的 i 一 节点 包含 指向 数据 块 的 指针 。 设 备 文件 的 [一 节点 包含 指向 内 核子 程序 
表 的 指针 。 主 设备 号 用 于 告知 从 设备 读 取 数据 的 那 部 分 代码 的 位 置 ， 

考虑 一 下 read 是 如 何 工作 的 。 内 核 首先 找到 文件 描述 符 的 i 节点 ;该 i- 节点 用 于 告诉 
内 核 文件 的 类 型 。 如 果 文 件 是 磁盘 文件 ， 那么 内 核 通过 访问 块 分 配 表 来 读 取 数 据 。 如 果 文 
件 是 设备 文件 ,那么 内 核 通过 调用 该 设备 驱动 程序 的 read 部 分 来 读 取 数据 。 其 他 的 操作 , 例 
如 open, write,lseek 和 close 等 都 是 类 似 的 。 


5.3 设备 与 文件 的 不 同 之 处 


磁盘 文件 和 设备 文件 都 有 文件 名 和 属性 ,从 表面 上 看 很 类 似 。 系 统 调用 open 用 于 创建 
与 文件 和 设备 的 连接 。 但 是 与 磁盘 文件 的 连接 不 同 于 与 终端 的 连接 。 图 5 2 显示 了 带 有 两 
个 文件 描述 符 的 进程 ,一 个 是 到 磁盘 文件 的 连接 ， 为 一 个 是 到 终端 用 户 的 连接 。 





BUMP T. ERR. i 
BAAR HATS. 


图 5.2 拥有 两 个 文件 描述 的 进程 
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现在 已 经 了 解 了 一 些 关 于 连接 的 内 部 情况 。 与 磁盘 文件 的 连接 通常 包含 内 核 缓冲 区 。 
从 进程 到 磁盘 的 字 节 先 被 缓冲 ,然后 才 从 内 核 的 缓冲 区 被 发 送出 去 。 磁 盘 连 接 具有 缓冲 这 
样 一 个 属性 。 到 终端 的 连接 则 不 同 ,进程 需要 尽快 把 到 终端 的 数据 传送 出 去 。 

与 终端 或 调制 解 调 器 的 连接 也 具有 属性 。 连 接 拥有 波 特 率 、 奇 偶 位 、 暂 停 位 的 个 数 。 一 
般 情况 下 所 输入 的 字符 都 会 显示 在 屏幕 上 ,但 是 有 些 时 候 ; 例 如 当 输 入 密码 时 ,字符 并 不 回 
显 在 屏幕 上 。 回 显 字符 不 是 键盘 任务 的 一 部 分 ,也 不 是 程序 应 该 做 的 ; 回 显 是 连接 的 一 个 属 
性 ,到 磁盘 文件 的 连接 没有 这 些 属性 。 


连接 属性 和 控制 


Unix 让 文件 和 设备 既 有 相似 之 处 ,又 有 不 同 之 处 。 与 磁盘 文件 的 连接 不 同 于 与 调制 解 
调 器 的 连接 。 关 于 连接 的 属性 可 以 问 : 

1. 连接 可 有 哪些 属性 ? 

2. 如 何 检测 当前 的 属性 ? 

3. 如 何 改变 当前 的 属性 ? 

下 面 介绍 两 例 : 磁盘 连接 的 属性 和 终端 连接 的 属性 。 


5.4 磁盘 连接 的 属性 
系统 调用 open 用 于 在 进程 和 磁盘 文件 之 间 创 建 一 个 连接 。 该 连接 含有 若干 个 属性 ,下 
面 先 仔细 学 习 其 中 的 两 个 属性 ,然后 再 了 解 一 下 其 他 的 属性 。 
5.4.1 属性 1: 缓冲 


图 5. 3 显示 了 当 两 个 管道 通过 一 个 进程 单元 连接 时 文件 描述 符 的 情况 。 那 个 进程 单元 
是 用 来 进行 缓冲 和 完成 其 他 进程 任务 的 。 在 方 框 内 的 是 控制 变量 ,用 以 决定 文件 描述 符 应 
该 采取 哪个 进程 步骤 。 


设置 文件 描述 符 控 
制 驱动 器 如 何 运作 





5.3 数据 流 中 的 进程 单元 


可 以 通过 修改 控制 变量 改变 文件 描述 符 的 动作 。 例 如 ,通过 简单 的 3 步 操作 关闭 磁盘 组 
冲 , 如 图 5.4 所 示 。 
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改变 驱动 器 设置 : 
1. 获 取 设 置 
2. 修 改 设置 
| | 3. 存 储 设置 





图 5.4 修改 文件 描述 符 的 运作 


首先 ,生成 一 个 系统 调用 将 控制 变量 从 文件 描述 符 复 制 到 进程 。 然 后 ,修改 这 个 复制 过 
来 的 控制 变量 。 最 后 ,将 修改 过 的 值 送 回 内 核 。 新 的 设置 被 安置 在 进程 代码 中 ,内 核 根据 新 
的 设置 处 理 数据 。 下 面 是 遵循 上 述 3 步 的 代码 : 


# include <fcntl. h> 


int s; //settings 

s = fcntl (fd, F_GETFL); //get flags 

s | = O SYNC; //set SYNC bit 

result = fcntl (fd, F_SETFL, s); //set flags 

if (result == 1) > //if error 
perror ("setting SYNC") ; //report 


文件 描述 符 的 属性 被 编码 在 一 个 整数 的 位 中 。 系 统 调用 fcntl 通过 读 写 该 整数 位 来 控制 
文件 描述 符 。 


fcntl 


目标 控制 文件 描述 符 
头 文件 # include — fentl. h> 
# include <unistd. h> — 
# include — sys/types. h> 
函数 原型 i int result = fentl(int fd, int cmd); 
int result = fcntl(int fd, int cmd, long arg) ; 
int result = fcntl(int fd, int cmd, struct flock * lockp) ; 


参数 fd 需 控 制 的 文件 描述 符 
cmd 需 进 行 的 操作 
arg 操作 的 参数 
lock “ 锁 信 息 

返回 值 —1 ja Pik 


other 依 操作 而 定 





fcntl Æ fd 所 指定 的 文件 上 执行 操作 cmd. arg 代表 操作 cmd 所 使 用 的 一 个 参数 。 在 上 
例 中 ,参数 F_GETFL 得 到 当前 的 位 集 (也 就 是 flags). ZE s 存放 这 个 flag 集 。 位 逻辑 或 
操作 打开 位 O_SYNC。 该 位 告诉 内 核 ,对 write QUU O RA TEMATS A CBS ERE TERT T S 
回 ,而 不 是 在 数据 复制 到 内 核 缓冲 时 就 执行 默认 的 返回 操作 。 
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最 后 ,把 修改 过 的 设置 返回 内 核 。 将 F_SETFL 操作 作为 第 二 个 参数 ,将 修改 过 的 设置 
”作为 第 三 个 参数 。 这 3 个 步骤 (从 内 核 中 读 取 设置 到 变量 ,修改 这 些 设 置 ,将 设置 返回 内 核 ) 
是 Unix 中 读 取 和 修改 连接 属性 的 典型 方法 。 

iO SYNC 会 关闭 内 核 的 缓冲 机 制 ， seas ONE mild 最 好 不 要 关闭 缓冲 


5.4.2 属性 2: 自动 添加 模式 


文件 描述 符 的 另 一 个 属性 是 自动 添加 模式 (auto-append mode)。 自 动 添加 模式 对 于 大 
干 个 进程 在 同一 时 间 写 入 文件 是 很 有 用 的 。 

为 什么 自动 添加 是 有 用 的 ? 

考虑 日 志文 件 wtmp。wtmp 存储 所 有 的 登录 和 退出 记录 。 当 一 个 用 户 登录 时 ， 程序 
login 在 wtmp 的 末尾 追加 一 条 登录 记录 。 当 一 个 用 户 退 出 时 ,系统 在 wtmp 的 末尾 追加 一 
条 退出 的 记录 ,如 同系 统 维护 的 日 记 一 样 。 这 就 像 人 们 写 日 记 一 样 ,每 篇 都 被 添加 在 末尾 。 

不 能 使 用 lseek 在 未 尾 进行 添加 记录 吗 ? 考虑 一 下 登录 的 逻辑 ,如 图 5.5 Br. 


用 如 下 系统 调用 将 数据 
添加 到 文件 : 


lseek (fd,0,SEEK END); 
write (fd,&rec,len); 





图 5.5 JH lseek 和 write 进行 添加 


Iseek 将 当前 位 置 移 到 文件 的 末尾 ,然后 添加 登录 的 记录 。 这 里 会 产生 什么 错误 呢 ? 
如 果 两 个 人 同时 登录 将 会 发 生 什 么 ? 含有 时 间 过 程 , 如 图 5.6 所 示 。 


时 间 APA 登录 ios 


Ls lseek (fd, 0, SEEK_END) ; 


2° iseek(£d,0,SEEK_END) ; 


write(fd,&rec,len); 


WwW 
"oma 


41 write(fd,&rec,len); 


图 5.6 T 和 write 所 引起 的 混乱 


wtmp 文件 显示 在 中 间 ,时 间 箭 头 在 左边 ,并 显示 了 4 个 时 间 片 断 。 用 户 A 登录 的 代码 
显示 在 左边 ,用 户 B 登 录 的 代码 显示 在 右边 。 到 现在 为 止 一 切 都 正常 吗 ? 一 个 重要 的 事实 
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是 ,Unix 是 一 个 时 间 共 享 系 统 , 这 个 过 程 需要 两 个 独立 的 步骤 : lseek 和 write. 
现在 仔细 看 看 下 面 : 

。 时 间 1 一 B 的 登录 进程 定位 文件 的 未 尾 

。 时 间 2 一 B 的 时 间 片 用 完 ,A 的 登录 进程 定位 文件 的 未 尾 

。 时间 3 一 A 的 时 间 片 用 完 ,B 的 登录 进程 写 人 记录 

。 时 间 4 一 B 的 时 间 片 用 完 ,A 的 登录 进程 写 人 记录 

因此 ,A 的 登录 进程 写 人 的 记录 覆盖 了 B 的 记录 ,B 的 登录 记录 丢失 。 

这 种 情况 被 称 为 竞争 (race condition) 。 这 两 个 进程 所 共享 的 网 状 效应 依赖 于 这 两 个 进 
程 如 何 规划 。 在 时 间 方 面 做 一 个 小 的 改动 ,可 能 A 的 登录 记录 会 丢失 ,可 能 两 个 都 不 会 
BR, | 

如 何 避 免 这 种 竞争 ? 有 很 多 方法 避免 竞争 。 竞争 是 系统 编程 所 面临 的 重要 问题 ,后 面 
需要 多 次 回 到 这 个 话题 。 在 这 个 特定 的 情况 中 ,内 核 提供 一 个 简单 的 解决 办 法 : 自动 添加 模 
式 。 当 文件 描述 符 的 O_APPEND 位 被 开启 后 ,每 个 对 write 的 调用 自动 调用 lseek 将 内 容 
添加 到 文件 的 末尾 。 

下 面 的 代码 启动 自动 添加 模式 ,然后 调用 write: 


it include «fcntl. h> 


int s; / / settings 
S = fcntl ( fd, F_GETFL); //qet flags 
s |= O APPEND; //set APPEND bit 
result = fcntl ( fd, F SETFL, s); //set flags 
if ( result == -1) //if error 
perror ( "setting APPEND"); // report 
else | 
write (fd, &rec, 1); / /write record at end 


术语 竞争 和 原子 操作 (atomoc operation) 48 E] JH XE. Xt Iseek 和 write 的 调用 是 独立 的 
系统 调用 ,内核 可 以 随时 打 断 进程 ,从 而 使 后 面 这 两 个 操作 被 中 断 。 当 O_APPEND 被 置 位 ， 
内 核 将 lseek 和 write 组 合成 一 个 原子 操作 ,被 连接 成 一 个 不 可 分 割 的 单元 。 


5.4.3 用 open 控制 文件 描述 符 


O SYNC 和 O_APPEND 是 文件 描述 符 的 两 个 属性 ,其 他 的 属性 将 在 后 面 的 章节 中 讨 
iE. fentl 的 联机 帮助 列 出 了 你 的 系统 上 所 支持 的 所 有 选项 和 操作 。 

fentl 并 不 是 仅 有 的 用 来 设置 文件 描述 符 属 性 的 方法 。 通 常 在 打开 一 个 文件 时 ,应 该 知 
道 需要 怎样 的 设置 。 可 以 通过 系统 调用 open 的 第 二 个 参数 的 一 部 分 来 设置 文件 描述 符 的 属 
性 位 。 例 如 ,调用 : 


fd = open ( WIMP FILE, O WRONLY | O APPEND | O SYNC); 


以 写 方式 打开 文件 wtmp 并 将 O_APPEND 和 O. SYNC 位 开启 open 的 第 二 个 参数 不 
只 是 读 、 写 或 读 / 写 的 选择 。 
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例如 ,可 以 通过 open 创建 一 个 包含 O_CREAT 标志 位 的 文件 。 以 下 两 个 调用 是 等 
价 的 : 


fd = creat ( filename, permission bits); 
fd = open ( filename, O CREAT | O TRUNC | O WRONLY, permission bits); 


为 什么 open 可 以 实现 相同 的 功能 ,而 creat 依旧 存在 ? 在 老 的 版 本 中 ,open 仅仅 用 来 打 
开 文 件 ,creat 用 来 创建 新 的 文件 。 随 后 ,open 被 多 次 修改 以 支持 更 多 的 标志 位 ,包括 创建 文 
件 选 项 。 

open 文 持 的 其 他 标志 位 : 


O CREAT 如果 不 存在 ,创建 该 文件 。 可 查看 0_EXCL。 
O TRUNC 如 果 文 件 存在 ,将 文件 长 度 置 为 0。 
0_EXCL 0_EXCL 标志 位 防止 两 个 进程 创建 同样 的 文件 。 如 果 文 件 存 在 且 0_EXCL 被 置 位 , 则 返回 - 1。 


O CREAT 和 O EXCL 的 组 合用 来 消除 以 下 竞争 情况 : 如 果 两 个 进程 同时 创建 相同 的 文 
件 将 会 发 生 什 么 情况 ? 例如 ,如 果 两 个 进程 都 要 写 wtmp, 但 是 这 个 文件 不 存在 时 ,都 要 创建 该 
文件 ,此 时 会 发 生 什 么 情况 ?程序 能 够 先 调用 stat 查看 文件 是 否 存 在 ,如 果 不 存在 ,就 调用 
creat。 当 stat 和 creat 间 的 过 程 被 打 断 时 ,问题 就 出 现 了 。O_EXCL/O_CREAT 的 组 合 将 这 两 
个 调用 构成 了 一 个 原子 操作 。 虽 然 想法 很 好 ,但 是 这 种 方法 在 某 些 重要 场合 并 不 可 行 。 一 个 可 
靠 的 替代 方案 是 使 用 link。 本 章 的 练习 提供 了 一 个 例子 。 


5.4.4 磁盘 连接 小 结 


内 核 在 磁盘 和 进程 间 传输 数据 。 内 核 中 进行 这 些 传输 的 代码 有 很 多 选项 。 程 序 可 使 用 
open 和 fcntl 系统 调用 控制 这 些 数据 传输 的 内 部 运作 ,如 图 5. 7 Bron. 


文件 描述 符 


连接 设置 





图 5.7 与 文件 的 连接 具有 属性 设置 
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5.5 终端 连接 的 属性 


系统 调用 open 在 进程 和 终端 之 间 创 建 一 个 连接 。 现在 来 仔细 了 解 一 下 与 终端 连接 的 一 
些 属性 。 


5.5.1 终端 的 IVO 并 不 如 此 简单 


终端 和 进程 之 间 的 连接 看 起 来 简单 。 通 过 使 用 getchar 和 putchar 就 能 够 在 设备 和 进程 
间 传 输 字 节 。 数据 流 的 这 种 抽象 使 得 键盘 和 屏幕 看 起 来 就 像 在 进程 中 一 样 ,如 图 5. 8 所 示 。 





图 5.8 一 个 简单 .直接 连接 的 流程 
一 个 简单 的 实验 表明 这 个 模型 并 不 完整 。 考虑 以 下 这 个 程序 : 


/* listchars.c 
* purpose; list individually all the chars seen on input 
.* output: char and ascii code, one pair per line 
* input: stdin, until the letter Q 
* notes; usesful to show that buffering/editing exists 
x/ | 
# include <stdio.h> 
main() 
{ 
int-e; n = 0; 
while( ( c = getchar()) l= 'Q') 
printf("char % 3d is %c code $03", itte 6); 


r 


j 


这 个 程序 以 一 个 接 一 个 的 方式 处 理 字符 , 读 取 字符 ,打印 数值 .字符 本 身 以 及 它 的 内 部 
代码 。 编 译 并 运行 这 个 程序 ,结果 如 下 所 示 ， 


$ ./listchars 
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一 


hello 
char 0 is h code 104 


char 1 is e code 101 

char 2 is 1 code 108 
. char 3 is 1 code 108 

char 4 is o code 111 

char 5 is 

code 10 


Q 
5 


接 下 来 会 发 生 什么 事情 ? 如 果 字 符 代码 直接 从 键盘 流向 getchar, 则 在 每 个 字符 后 可 看 
到 一 个 响应 。 输 入 单词 hello 中 的 5 个 字符 并 按 回 车 键 。 然 而 仅 在 这 个 时 候 , 程 序 才 开始 处 
理 这 些 字符 。 输 入 看 起 来 被 缓冲 了 。 就 像 流向 磁盘 的 数据 ,从 终端 流出 的 数据 在 沿途 中 的 
某 个 地 方 被 存储 起 来 了 。 

listchars 显示 了 另外 一 些 内 容 。Enter 键 或 Return 键 通 党 发 送 ASCII f8 13, 即 回 车 符 。 
listchars 的 输出 显示 ASCII $3 13 被 换行 符 ( 代 码 10) 所 替代 。 

第 三 种 处 理 影 响 程序 的 输出 。listchars 在 每 个 字符 串 的 末尾 添加 一 个 换行 符 (\n)。 换 
行 符 代 码 告诉 鼠标 移 到 下 一 行 ,但 没有 告诉 它 移 到 最 左边 。 人 代码:13( 回 车 符 ) 告 诉 鼠 标 回 到 
fx FE vita © 

运行 listchars 表明 在 文件 描述 符 的 中 间 必 定 有 一 个 处 理 层 。 图 5. 9 显示 了 该 层 的 部 分 
作用 。 











程序 发 送 '\n', 但 
是 显示 器 接收 到 
‘\r' RI 。 
FAP RIA '\r'. 
但 是 程序 接收 到 


NA 







图 5.9 ”内核 处 理 终端 数据 


这 个 例子 说 明了 3 种 处 理 : 

l. 进程 在 用 户 输入 Return 后 才 接 收 数据 ; 

2. 进程 将 用 户 输入 的 Return ASCII 码 13) 看 作 换 行 符 (ASCII 码 10); 
3. 进程 发 送 换行 符 , 终 端 接收 回 车 换行 符 。 


D 你 可 以 向 你 的 和 爷爷 请 教 如 何在 打字 机 上 推 左 侧 手 柄 使 打字 头 回 到 纸 的 左边 。 
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与 终端 的 连接 包含 一 套 完 整 的 属性 和 处 理 步骤 。 
5.5.2 终端 驱动 程序 
终端 和 进程 之 间 的 连接 如 图 5. 10 所 示 。 





图 5.10 终端 驱动 器 是 内 核 的 一 部 分 


处 理 进程 和 外 部 设备 间 数 据 流 的 内 核子 程序 的 集合 被 称 为 终端 驱动 程序 或 tty 驱动 程 
FO, 驱动 程序 包含 很 多 控制 设备 操作 的 设置 。 进 程 可 以 读 、 修 改 和 重 置 这 些 驱动 控制 
标志 o 


8.5.3 sty 命令 


stty 命令 让 用 户 读 取 和 修改 终端 驱动 程序 的 设置 。 
(1) 使 用 stty 显示 驱动 程序 设置 
stty 的 输出 如 下 所 示 : 


S stty 

speed 9600 baud; line - 0; 
$ stty - all 

speed 9600 baud; rows 15; columns 80; line = 0; 

intr = ^C; quit = ^V; erase = ^7; kill = ^U; eof = ^D; eol = <undef>; 
eol2 = <undef>; start = ^Q; stop = ^S; susp = ^2; rprnt = ^R; werase = ^W; 
lnext = ^V; flush = ^0; min = 1; time = 0; 
- parenb ~ parodd cs8 - hupcl - cstopb cread - clocal - crtscts 

- ignbrk brkint ignpar - parmrk - inpck istrip — inlcr - igncr icrnl ixon - ixoff 

- iuclc - ixany imaxbel 

opost — olcuc - ocrnl onlcr - onocr - onlret - ofill ~ ofdel n10 cro tab0 bsO vt0 ff0 


isig icanon iexten echo echoe echok ~ echonl - noflsh — xcase ~ tostop - echoprt 





(D tty 是 指 由 Teletype 公司 生产 的 老式 打印 终端 。 
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echoctl echoke 


默认 选项 的 列表 很 简洁 。 如 加 上 选项 -all 则 将 列 出 更 多 的 设置 。 有 些 设置 是 有 值 的 变 
量 , 有 些 是 布尔 值 。 例 如 , 波 特 率 和 屏幕 的 行 数 与 列 数 拥有 数值 。 像 intr quit 和 eof 这 些 项 
拥有 字符 值 。 而 像 icrnl、-olcuc 和 onler 的 值 是 开 或 关 。 

这 些 意味 着 什么 ? icrnl 是 Input:convert Carriage Return to NewLine( 输 入 时 将 回 车 转 
换 为 换行 ) 的 缩写 , 即 在 前 面 的 例子 中 驱动 程序 所 做 的 操作 。 缩 写 onler 代表 Output:add to 
NewLine a Carriage Return( 输 出 时 在 新 的 一 行 中 加 入 回 车 )。 一 个 属性 前 的 减 号 表示 这 个 
操作 被 关闭 。 例 如 , -olcuc 表示 动作 Output:convert LowerCase to UpperCase( 输 出 时 将 小 
写字 母 转 换 成 大 写 ) 被 禁止 。 很 多 早期 的 终端 只 显示 大 写字 母 ,所 以 那 时 将 输出 转换 成 大 写 
RAH. 

(2) 使 用 stty 改变 驱动 程序 设置 

这 里 是 一 些 使 用 stty 修改 驱动 程序 属性 的 例子 : 


$ stty erase X it make 'X' the erase key 
$ stty - echo # type invisibly 
$ stty erase @ echo # multiple requests 


在 第 一 个 例子 中 ,使 用 stty 用 来 改变 删除 键 。 退 格 键 或 删除 键 是 典型 设置 ,但 是 可 以 将 
“任何 键 作为 删除 键 了 。 在 第 二 个 例子 中 ,关闭 按键 回 显 。 当 输入 密码 时 ,字符 并 不 回 显存 屏 
幕 上 。 关 闭 这 个 回 显 意 味 着 能 够 打字 ,但 是 看 不 到 所 输入 的 字符 。 在 第 三 个 例子 中 ,使 用 
stty 一 次 性 改变 多 种 设置 。 同 时 将 删除 键 改 为 @ ,并 将 回 显 模式 开 启 。 

stty 如 何 运作 ? 现在 能 够 编写 stty 了 吗 ? 


5.5.4 编写 终端 驱动 程序 : 关于 设置 


tty 驱动 程序 包含 很 多 对 传人 的 数据 所 进行 的 操作 。 这 些 操作 被 分 为 4 种 ， 

。 输入: 驱动 程序 如 何 处 理 从 终端 来 的 字符 

。 输 出: 驱动 程序 如 何 处 理 流向 终端 的 字符 

+ 控制 : 字符 如 何 被 表示 一 一 位 的 个 数 、 位 的 奇偶 性 .停止 位 等 

。 本地: 驱动 程序 如 何 处 理 来 自 驱动 程序 内 部 的 字符 | 

输入 处 理 包 括 将 小 写字 母 转换 为 大 写字 母 ,去 除 最 高 位 及 将 回 车 符 转 换 为 换行 符 。 输 
出 处 理 包 括 用 若干 个 空格 符 代替 制 表 符 , 将 换行 符 转 换 为 回 车 符 及 将 小 写字 母 转换 为 大 写 
字母 。 控 制 设置 包括 奇偶 性 及 停止 位 的 个 数 。 本 地 处 理 包括 回 显 字符 给 用 户 及 缓冲 输入 衣 
到 用 户 按 回 车 键 。 

除了 天 和 关 设置 外 ,驱动 程序 维护 了 一 张 含 有 特殊 意义 键 的 列表 。 例 如 ,用 户 可 能 按 退 
格 键 来 删除 一 个 字符 。 终 端 驱动 程序 会 注意 并 处 理 这 个 删除 键 。 除 此 之 外 ,终端 驱动 程序 
还 负责 对 其 他 一 些 控制 字符 进行 处 理 。 

联机 帮助 上 列 出 了 stty 大 部 分 的 设置 和 控制 字符 。 





(D 部 分 Unix shell 处 理 此 命令 ,并 提供 比 驱动 程序 更 强大 的 功能 ,而 不 在 驱动 程序 中 处 理 此 命令 。 
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5.5.5 编写 终端 驱动 程序 : 关于 函数 


改变 终端 驱动 程序 的 设置 就 像 改变 磁盘 文件 连接 的 设置 一 样 : 
(1) 从 驱动 程序 获得 属性 ; 

(2) 修改 所 要 修改 的 属性 ; 

(3) 将 修改 过 的 属性 送 回 驱 动 程序 。 

例如 ,以 下 代码 为 一 个 连接 开启 字符 回 显 : 


i include — termios. h> 


struct termios attribs; /* struct to hold attributes «/ 
tcgetattr ( fd, &settings); /* get attribs from driver x/ 
settings.c lflag | = ECHO; /* turn on ECHO bit in flagset x/ 


tcsetattr ( fd, TCSANOW, &settings); /x send attribs back to driver */ 


通常 的 过 程 在 图 5.11 中 进行 描述 。 


# include <termios. h> 
struct termios settings; 
tcgetattr(fd,&settings); 


/* test, set, or 
clear bits */ 


tcsetattr(fd, how, &settings); 





图 5. 11 调用 tcgetattr 和 tcsetattr 控制 终端 驱动 器 


FE PRL tcgetattr 和 tcsetattr 提供 对 终端 驱动 程序 的 访问 。 两 个 函数 在 termios 结构 中 
交换 设置 。 以 下 是 详细 描述 。 | 





; tcgetattr 

目标 读 取 tty 驱动 程序 的 属性 
头 文 件 # include — termios. h> 

# include — unistd, h> 
函数 原型 int result = tcgetattr(int fd, struct termios x info); 
参数 fd 与 终端 相 联 的 文件 描述 符 

info 指向 终端 结构 的 指针 
返回 值 mil 遇 到 错误 

0 成 功 返 回 


一 IIIe 
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tcgetattr 从 与 文件 fd 相关 的 终端 驱动 程序 中 获取 当前 设置 ,并 把 它 复制 到 info 指针 所 





指 的 结构 中 。 
tcsetattr 
目的 设置 tty 驱动 程序 的 属性 
头 文件 # include «termios. h> 
| # include «unistd. h> 
BR Er Js I | int result = tcsetattr(int fd, int when, struct termios * info); 
参数 fd 与 终端 相 联 的 文件 描述 符 
when 改变 设置 的 时 间 
info 指 回 终端 结构 的 指针 
返回 值 一 遇 到 错误 


0 成 功 返回 | 

tcsetattr 从 info 所 指 的 结构 中 将 驱动 程序 的 设置 复制 到 与 文件 fd 相关 的 终端 驱动 程序 
H. when 参数 告诉 tcsetattr 在 什么 时 候 更 新 驱动 程序 设置 。when 的 允许 值 如 下 所 示 ，。 

(1) TCSANOW 

”立即 更 新 驱动 程序 设置 。 

(22 TCSADRAIN 

等 待 直到 驱动 程序 队列 中 的 所 有 输出 都 被 传送 到 终端 。 然 后 进行 驱动 程序 的 更 新 ， 

(3) TCSAFLUSH 

等 待 直到 驱动 程序 队列 中 的 所 有 输出 都 被 传送 出 去 。 然 后 ,释放 所 有 队列 中 的 输入 数 
据 , 并 进行 一 定 的 变化 。 


5.5.6 编写 终端 驱动 程序 : 关于 位 


termios 结构 类 型 包括 若干 个 标志 集 和 一 个 控制 字符 的 数组 。 所 有 的 Unix 版 本 包含 以 
PST. 


struct termios 


| 


tcflag t c iflag; /* input mode flags x/ 
tcflag t c oflag; /x output mode flags x/ 
tcflag t c cflag; /* control mode flags x/ 
tcflag t c lflag; /* local mode flags */ 
cc t c cc[NCCS]; /x control characters x/ 


speed t c ispeed; /* input speed x/ 
speed t c ospeed; /* output speed x/ 
^s 


PA BK ash FE FF E BSEC DO DUREE AMETE c_ispeed 和 c ospeed 成 员 中 ， 





第 5 章 连接 控制 : 学 习 suy 。 141 。 


-每 个 标志 集 的 独立 位 的 含义 如 图 5. 12 Bron. 
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图 5.12 终端 变量 中 的 位 和 字符 


首先 描述 的 4 个 成 员 是 标志 集 。 每 个 标志 集 包 含 在 该 组 中 的 操作 位 。 例 如 ,成 员 c_iflag 
设置 INLCR 值 的 位 。 成 员 c_cflag KEE PARODD 的 值 , 其 功能 是 设置 奇偶 性 。 所 有 这 
些 掩 码 都 定义 在 termios. h 中 。 如 从 驱动 程序 中 读 取 当前 的 属性 到 termios 结构 中 时 ,这 个 
结构 中 的 所 有 值 都 可 以 被 检验 和 修改 。 

成 员 c_cc 是 控制 字符 的 数组 。 含 有 特殊 功能 的 键 都 被 存储 在 这 个 数组 中 。 数 组 中 的 每 
个 位 置 都 由 termios. h 中 的 常量 所 定义 。 例 如 ,attribs. c_cc[VERASE] = Ab ' 告 诉 驱 动 程 
序 将 退 格 键 作 为 删除 键 。 

现在 已 经 知道 如 何 从 驱动 程序 获得 设置 和 如 何 将 设置 存 回 驱 动 程序 ,下 面 看 看 修改 驱 
动 程序 属性 的 技术 。 

每 个 属性 在 标志 集中 都 占有 一 位 。 属 性 的 掩 码 定义 在 termios. h 中 。 要 测试 一 个 属性 ， 
需要 将 标志 集 与 那个 位 的 掩 码 相 与 。 要 启动 这 个 属性 ,将 该 位 开启 。 要 禁止 这 个 属性 ,将 该 
位 关闭 。 上 面 的 情况 如 下 所 示 : 
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操作 代 码 

测试 位 if ( flagset & MASK ) ... 
置 位 flagset | = MASK 

清除 位 flagset & = ~MASK 


5.5.7 编写 终端 驱动 程序 : 几 个 程序 例子 


1. 例子 echostate. c 显示 回 显 位 的 状态 
第 一 个 例子 说 明 终端 是 否 被 设置 成 回 显 字 符 的 模式 。 读 取 设 置 ,测试 位 ,并 报告 结果 : 





/* echostate.c 

* reports current state of echo bit in tty driver for fd 0 
* shows how to read attributes from driver and test a bit 
x/ 

# include <stdio.h> 

H+ include <(termios. h> 

main() 

{ 

struct termios info; 


int rv; 


rv = tcgetattr( 0, &info ); /* read values from driver x/ 
if (rv == -1){ 
perror( "tcgetattr"); 
exit(1); 
j 
if ( info.c lflag & ECHO ) 
printf(" echo is on , since its bit is 1\n"); 
else 
printf(" echo is OFF, since its bit is 0\n"); 


j 


这 个 程序 为 文件 描述 符 0 读 取 终端 属性 。0 是 标准 输入 的 文件 描述 符 , 该 文件 描述 符 通 
常 附属 在 键盘 上 。 这 里 是 编译 和 运行 程序 的 一 个 例子 ， 


$ cc echostate.c - o echostate 
$ ./echostate 

echo is on, since its bit is 1 
S stty - echo 

S ./echostatr: not found 


$ echo is OFF, since its bit is 0 


这 个 例子 显示 命令 stty - echo 关闭 驱动 器 里 的 击 键 回 显 。 用 户 在 这 之 后 输入 了 另外 两 
个 命令 ,但 它们 在 屏幕 上 并 不 显示 。 另 一 方面 ,对 那 两 行 的 输出 响应 仍然 显示 。 
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改变 回 显 位 的 状态 





2. 例子 ; setecho.c 
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第 二 个 例子 将 键盘 回 显 开 或 关 。 如 果 命 令 行 参 数 以 “y” 开 始 ,终端 的 回 显 标志 被 开局 。 


否则 回 显 被 关闭 。 程 序 如 下 所 未 : 


/* setecho.c 

x usage: setecho | y|n] 

* shows; how to read, change, reset tty attributes 
# include — «stdio.h— 

# include < termios. h> 


# define oops(s,x) | perror(s); exit(x); } 


main(int ac, char x av[ ]) 


1 


struct termios info; 


if (ac == 1) 
exit(0); 
if ( tegetattr(0,&info) == -1) /* get attribs x/ 
oops("tcgettattr", 1); 
if Cav[1][0] == ty’) 
info.c lflag | » ECHO ; /x turn on bit x/ 
else 
info.c lflag &= ~ECHO ; /* turn off bit x/ 
if ( tcsetattr(0, TCSANOW,&info) == -1) /* set attribs x/ 


oops("tcsetattr",2); 
j 


测试 并 运行 这 两 个 程序 以 及 正常 模式 下 的 stty: 


$ echostate; setecho n ; echostate ; stty echo 
echo is on, since its bit is 1 — 

echo is OFF, since its bit is 0 

$ stty - echo; echostate ; setecho y ; setecho n 


echo is OFF, since its bit is 0 


在 第 一 个 命令 行使 用 setecho 关闭 回 显 。 然 后 使 用 stty 将 回 显 重新 开启 。 驱 动 程序 
驱动 程序 设置 被 存储 在 内 核 ,而 不 是 在 进程 。 一 个 进程 可 以 改变 驱动 程序 里 的 设置 , 另 一 人 


不 同 的 进程 可 以 读 取 或 修改 设置 。 
3. 例子 : showtty.c 显示 大 量 驱 动 程序 属性 





和 
个 


可 以 重复 用 setecho. c 和 echostate. c 中 的 技术 建立 一 个 完整 的 stty 版 本 。tty 驱动 程序 
包含 3 种 设置 : 特殊 字符 、 数 值 和 位 。showtty 包含 显示 这 些 数据 类 型 的 函数 。 以 下 是 代码 ， 


/* showtty.c 
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x displays some current tty settings 


*/ 


# include <stdio.h> 
# include —| «termios. h> 


main( ) 


{ 


} 


showbaud ( cfgetospeed( &ttyinfo ) ); 


struct termios ttyinfo; /* this struct holds tty info x/ 
if ( tegetattr( 0 , &ttyinfo ) == -1 ){ /x get info x/ 
perror( "cannot get params about stdin"); 


exit(1): 


/* show info x/ 
/* get + show baud rate x/ 


printf ("The erase character is ascii *d, Ctrl- %c\n", 
ttyinfo. c_cc| VERASE], ttyinfo.c cc[VERASE]- 1 + 'A'); 

printf("The line kill character is ascii %d, Ctrl- %c\n", 
ttyinfo.c cc[VKILL], ttyinfo.c_cc[VKILL]~1+ 'A'),; 


show some flags( &ttyinfo ); /* show misc. flags */ 


showbaud( int thespeed ) 


/ 


1 


j 


* 


* prints the speed in english 


*/ 


printf( "the baud rate is "); 

switch ( thespeed )( 
case B300;  printf("300Xn'); break; 
case B600; printf("600\n"); break; 
case B1200; printf("1200Mn"); break; 
case B1800: printf("1800\n") ; break; 
case B2400; printf("2400\n"); break; 
case B4800; printf("4800\n"); break; 
case B9600; printf("9600\n"); break; 
default; printf("Fast\n"); break; 


struct flaginfo { int fl value; char x fl name; ); 


struct flaginfo input flags[|] = | 


IGNBRK , "Ignore break condition", 

BRKINT , "Signal interrupt on break", 
IGNPAR , "Ignore chars with parity errors", 
PARMRK , "Mark parity errors", 
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INPCK , "Enable input parity check", 
ISTRIP , "Strip character", 


INLCR , "Map NL to CR on input", 

IGNCR , "Ignore CR", 

ICRNL , "Map CR to NL on input", 

IXON , "Enable start/stop output control", 

/x IXANY , "enable any char to restart output", x/ 
IXOFF , "Enable start/stop input control", 

0, NULL } ; 


struct flaginfo local flags|] = { 


ISic , "Enable signals", 
ICANON , "Canonical input (erase and kill)", 
/x XCASE , "Canonical upper/lower appearance", x/ 


ECHO , "Enable echo", 

ECHOE , "Echo ERASE as BS - SPACE - BS", 
ECHOK , "Echo KILL by starting new line", 
0 NULL } ; 


f F 


show_some_flags( struct termios * ttyp ) 
/* 
* show the values of two of the flag sets : c iflag and c lflag 
* adding c oflag and c cflag is pretty routine - just add new 
* tables above and a bit more code below. 
*/ 
{ 
show flagset( ttyp —^c iflag, input flags ); 
show flagset( ttyp —»c lflag, local flags ); 
} 
show flagset( int thevalue, struct flaginfo thebitnames[ | ) 
/* 
* check each bit pattern and display descriptive title 
x/ 
{ 
int i; 


for ( i=0; thebitnames|ij|.fl value ; 


pitt) { 

printf( " *s is ", thebitnames[i].fl name); 

if ( thevalue & thebitnames[ i]. fl value ) 
printf("ON\n") ; 

else 


printf("OFF\n") ; 
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showtty 用 来 显示 驱动 程序 里 16 个 属性 的 当前 状态 ,并 附 有 注释 。 程 序 使 用 了 结构 表 
以 简化 代码 。 一 个 简单 的 函数 show_flagset 接收 一 个 整数 和 驱动 程序 标志 集 。 如 在 这 个 程 
序 中 增加 其 他 的 标志 集 需 要 些 什 么 呢 ? 将 这 个 程序 转换 成 完整 版 本 的 stty 需要 些 什么 呢 ? 


5.5.8 终端 连接 小 结 


终端 是 人 们 用 来 和 Unix 进程 进行 通信 的 设备 。 终 端 拥 有 一 个 可 以 让 进程 读 取 字 符 的 
键盘 和 可 让 进程 发 送 字符 的 显示 器 。 终 端 是 一 个 设备 ,所 以 它 在 目录 树 中 表现 为 一 个 特殊 
的 文件 ,通常 在 /dev 这 个 目录 中 。 

进程 和 终端 间 的 数据 传输 和 数据 处 理由 终端 驱动 程序 负责 ,终端 驱动 程序 是 内 核 的 一 
部 分 。 该 内 核 代码 提供 缓冲 .编辑 和 数据 转换 。 程 序 可 通过 调用 tcgetattr 和 tcsetattr 查看 
和 修改 该 驱动 程序 的 设置 。 


5.6 其 他 设备 编程 : ioctl 


到 磁盘 文件 的 连接 有 一 个 属性 集 , 到 终端 的 连接 有 另外 一 个 属性 集 。 到 其 他 类 型 设备 
的 连接 是 怎样 的 呢 ? | 

考虑 CD 刻录 机 。 可 擦 写 的 CD 能 够 被 删除 内 容 , 能 以 不 同 的 速度 刻录 CD。 扫 描 仪 有 
目 己 的 设置 ,如 解析 度 和 颜色 深度 等 。 其 他 类 型 的 设备 有 各 自 的 属性 集 。 程 序 员 如 何 查看 
和 控制 一 个 设备 的 设置 呢 ? 

每 个 设备 文件 都 支持 系统 调用 ioctl 





ioctl 








目标 | 控制 一 个 设备 
头 文件 it include <sys/ioctl. h>> 
p Ar Iri Rl int result = ioctl Cint fd, int operation [ , arg... ] 5; 
参数 fd 与 设备 相 联 的 文件 描述 符 
Operation “和 需 进行 的 操作 
arg... 操作 所 需 参 数 
返回 什 一 1 发 生 错误 


other 依 设备 而 定 


系统 调用 ioctl 提供 对 连接 到 fd 的 设备 驱动 程序 的 属性 和 操作 的 访问 。 每 种 类 型 的 设 
备 都 有 自己 的 属性 集 和 ioctl 操作 集 。 

例如 ,一 个 终端 屏幕 ,有 一 个 以 行 和 列 或 者 是 以 像素 为 单位 的 大 小 属性 。 下 面 的 代码 显 
示 屏 幕 的 斥 才 。 


# include <sys/ioctl. h> 
void print screen dimensions( ) 
{ 


struct winsize wbuf; 
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if ( ioctl ( 0, TIOCGWINSZ, &wbuf) {= 一 1)1 
printf ("%d rows x %dcols\n", wbuf.ws row, wbuf.ws col); 
printf ("*d wide x *dtall\n", wbuf.ws xpixel, wbuf.ws ypixel); 
j 
j 


符号 TIOCGWINSZ 是 函数 代码 ,wbuf 的 地 址 是 该 设备 控制 函数 的 参数 。 

阅读 头 文件 是 了 解 设 备 类 型 以 及 相关 函数 的 好 方法 。 联 机 帮助 中 有 关 设备 的 内 容 也 包 
括 属 性 和 函数 的 列表 。 例 如 ,Linux 中 有 关 st(4) 的 联机 帮助 讲述 了 使 用 ioctl 控制 SCSI gf 
UE SE IE 


5.7 文件 .设备 和 流 


任何 数据 的 源 或 目的 地 都 被 Unix 视 为 文件 。 基 本 的 系统 调用 既 适 用 于 磁盘 文件 也 同 
伴 适 用 于 设备 文件 ,它们 的 区 别 体 现在 对 连接 的 操作 上 。 磁 盘 文 件 的 文件 描述 符 包含 对 组 
冲 属性 和 扩展 属性 的 定义 代码 。 终 端的 文件 描述 符 包 含 编辑 、 回 显 .字符 转换 和 其 他 操作 的 
属性 定义 代码 。 

可 以 把 每 个 处 理 步 骤 描 述 成 连接 的 一 个 属性 ,但 是 反 过 来 说 ,连接 也 可 以 看 作 是 处 理 步 
RAHE. 20 世纪 80 年 代 由 AT& 工 开发 的 一 个 Unix 版 本 System V 建立 了 一 个 以 处 理 序 
列 为 基础 的 数据 流 模型 。 这 有 点 像 清 洗 汽 车 。 首 先 ,将 肥皂 水 酒 在 车 上 。 然 后 用 大 刷子 擦 
去 灰尘 。 下 一 步 , 用 高 压 软 管 将 表面 的 肥皂 泡 淋 和 灰尘 清除 ,同时 使 用 车 盘 锈 抑制 剂 ,打上 
热 蜡 , 为 轮轴 盖 镀 铬 。 最 后 用 软 布 和 热 空 气 弄 干 表面 。 

当然 ,每 个 步骤 都 是 汽车 清洗 者 从 汽车 清洗 公司 买 来 部 件 完成 的 。 买 来 之 后 把 它们 安 
置 在 清洗 序列 中 的 某 个 位 置 ,整个 系统 就 可 以 工作 了 。 而 且 , 可 以 进行 重组 和 改造 ,比如 省 
略 某 些 特定 的 步骤 (注意 请 不 要 用 热 蜡 !)， 

这 是 数据 流 模型 和 连接 属性 的 流 模型 的 一 个 大 概 的 想法 。 流 模型 的 一 个 重要 特征 是 处 
理 的 模块 化 。 如 果 不 满意 仅 能 支持 像 大 小 写 转换 这 样 的 终端 驱动 程序 ,可 以 设计 并 安装 一 
个 可 将 数字 转换 成 罗马 数字 的 模块 。 也 就 是 ,可 以 编写 一 个 能 完成 从 阿拉 伯 数 字 到 罗马 数 
学 转换 的 处 理 模 块 。 将 它 写 到 流 模 型 规范 ,然后 使 用 特殊 的 系统 调用 将 该 模块 安装 到 系统 
上 。 流 数据 经 过 它 的 处 理 就 从 阿拉 伯 数 字 变 成 罗马 数字 了 。 

在 联机 帮助 上 查看 streamio 以 了 解 更 多 关于 通过 这 种 方式 管理 连接 属性 问题 的 解决 方 
案 。 在 某 些 版 本 的 Unix 中 , 流 用 来 实现 网 络 服务 。 


小 结 


1l. 主要 内 容 

。 内 核 在 进程 和 外 部 世界 间 交 换 数 据 。 外 部 世界 包括 磁盘 文件 .终端 和 外 部 设备 ( 像 打 
EN OL 、 磁 带 驱 动 器 .声卡 和 鼠标 ) 。 到 磁盘 文件 和 终端 的 连接 有 相似 之 处 但 也 有 差异 。 

”磁盘 文件 和 设备 文件 都 有 名 字 、 属 性 和 权限 位 。 标 准 文件 系统 调用 open, read, 
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write,close 和 lseek 可 被 用 于 任何 文件 或 设备 。 文 件 权 限 位 以 同样 的 方式 应 用 于 控 
制 设备 文件 和 磁盘 文件 的 访问 。 

。 到 磁盘 文件 的 连接 在 处 理 和 传输 数据 方面 不 同 于 到 设备 文件 的 连接 。 内 核 中 管理 与 
设备 连接 的 代码 被 称 为 设备 驱动 程序 。 通 过 使 用 fentl 和 ioctl, 进 程 可 以 读 取 和 改变 
设备 驱动 程序 的 设置 。 

。 到 终端 的 连接 是 如 此 的 重要 ,以 至 函数 tcgetattr 和 tcsetattr 专门 用 来 提供 对 终端 驱 
动 器 的 控制 。 

。 Unix 命令 stty 使 得 用 户 能 够 访问 tcgetattr 和 tcsetattr MA. 

2. 图 示 i 

进程 使 用 write 将 数据 写 人 文件 描述 符 , 用 read 从 文件 描述 符 读 出 数据 。 文 件 描述 符 可 

被 连接 到 磁盘 文件 .终端 和 外 部 设备 。 文 件 描述 符 指向 设备 驱动 程序 时 ,设备 驱动 程序 具有 
属性 设置 ,如 图 5. 13 所 示 。 


打印 机 端 





图 5.13 文件 描述 符 .连接 和 驱动 器 


3. 下 一 章 的 内 容 
从 磁盘 读 取 数 据 相 对 容易 ,但 是 从 用 户 终端 读 取 有 点 麻烦 ,因为 人 是 不 可 预知 的 。 需 要 
用 户 输入 数据 的 程序 可 以 利用 终端 驱动 器 的 一 些 特别 的 连接 控制 功能 。 在 下 一 章 中 将 详细 
了 解 一 些 有 关 用 户 程 序 编写 方面 的 主题 。 
4. 习题 
5.1 在 一 个 Linux 机 器 上 ,很 容易 读 取 鼠 标的 输出 。 做 这 个 工作 需要 处 于 文本 模式 。 
在 shell 中 ,确保 称 为 gpm 的 程序 不 在 运行 : 输入 gpm -k。 然 后 ,输入 cat /dev/ 
mouse。 然 后 移动 鼠标 并 按键 。 命 令 cat 从 设备 文件 中 读 取 数据 。 从 该 文件 读 取 
的 字 节 是 鼠标 产生 的 按键 次 数 和 移动 消息 。 


5.2 设备 文件 中 的 执行 位 是 什么 意思 ? 学 习 命 令 biff ,考虑 这 个 位 的 作用 。 


5.3 前 面 已 经 讨论 了 设备 文件 的 输入 /输出 如 何 运 作 。 那 么 像 In mv 和 rm 等 的 目录 
操作 如 何 运作 呢 ? 利用 图 5. 1, 解 释 这 三 个 命令 是 如 何 影响 目录 i- 节 点 和 驱动 程 
序 的 。 
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.4 命令 rm 和 系统 调用 unlink 删除 与 i- 节 点 的 一 个 链接 。 如 果 该 i- 节 点 的 链接 数 
降 为 0, 则 内 核 释 放 磁 盘 块 和 i- 节 点 。 设 备 i- 市 点 没有 分 配 列表 和 数据 块 。 取 而 
代 之 的 是 设备 文件 的 i- 节点 包含 指向 内 核 设备 驱动 子 程序 的 指针 。 如 果 删 除 设 
备 的 文件 名 , 则 内 核 释 放 i~ 节 点 ,驱动 程序 仍旧 在 内 核 中 。 如 何 新 创建 一 个 文件 
连接 到 该 设备 呢 ? Gea: 阅读 mknod) 


.5 考虑 为 文件 添加 内 容 时 的 竞争 情况 。 前 文中 的 讨论 描述 了 一 个 可 能 的 顺序 。 这 
两 个 进程 每 个 进程 有 两 个 操作 ,那么 有 多 少 种 顺序 组 合 的 可 能 性 呢 ? 每 种 顺序 的 
结果 是 什么 ? 


.6 查看 Linux 内 核 代 码 , 找 出 O_APPEND 位 是 在 何 处 被 校 验 的 。 自动 定位 是 如 何 
实现 的 ? 


.7 系统 调用 rename 是 个 原子 操作 。 在 这 个 单一 的 调用 中 合并 了 哪些 步骤 呢 ? 查看 
Unix 的 内 核 代码 ,以 了 解 所 有 的 竞争 情况 和 内 核 处 理 的 可 能 冲突 。Linux 代码 中 
的 解释 有 些 人 饶舌 和 有 趣 。 


.8 标准 库 范 数 fopen 支持 以 添加 模式 打开 文件 。 例 如 ,fopen ("data", "a")。 在 你 
的 系统 上 ,这 是 通过 添加 模式 开启 O_APPEND ,还 是 仅仅 在 打开 文件 后 定位 文件 
的 末尾 来 实现 的 呢 ? 找到 fopen 的 源 代 码 ,或 者 编写 一 个 程序 添加 模式 两 次 打开 
同一 个 文件 ,然后 交替 向 两 个 流 写 数据 。 根 据 所 发 生 的 现象 能 得 到 什么 结论 ? 


.9 例 程 echostate. c 报告 文件 描述 符 0 表示 的 驱动 器 回 显 位 的 状态 。 使 用 重 定向 符 
“二 ”将 标准 输入 定向 到 其 他 的 文件 或 设备 。 尝 试 以 下 试验 : 
echostate < /dev/tty 
echostate < /dev/lp 
echostate < /etc/passwd 
echostate < 'tty' 


说 出 每 个 命令 行 的 输出 。 


.10 程序 setecho 改变 附加 在 标准 输入 的 驱动 程序 的 回 显 位 。 如 果 将 标准 输入 重 定 

向 到 一 个 不 同 的 终端 ,就 可 以 改变 该 终端 的 回 显 位 。 

尝试 以 下 试验 。 

(1) 在 同一 台 机 器 上 登录 2 次 (或 在 机 器 上 打开 2 个 窗口 )。 

(2) 在 每 个 窗口 中 输入 tty, 以 找到 那 两 个 窗口 的 设备 文件 名 。 假 设 一 个 连接 到 / 
dev/ttyp1l, 另 一 个 连接 到 /dev/ttyp2。 

(3) 在 ttyp1, #7 A setecho n < /dev/ttyp2., 

(4) Æ ttyp2 窗口 ,输入 命令 echostate, 

(5) SRG ttypl, i A echostate < /dev/ttyp2, 

(6) 解释 发 生 的 情况 。 

(7) 用 命令 stty 做 同样 的 试验 。 
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可 能 有 一 天 ,你 会 发 现 这 个 功能 的 确 很 有 用 。 


前 文中 的 例子 为 tcgetattr 和 tcsetattr 调用 使 用 的 文件 描述 符 的 值 为 0。 第 一 个 
参数 是 文件 描述 符 , 也 可 以 是 任何 指向 到 终端 设备 连接 的 值 。 

文件 描述 符 1 指 问 标 准 输 出 。 修 改 echostate 和 setecho, 使 用 文件 描述 符 1 代替 
0。 这 个 变化 如 何 影 响 程序 的 执行 ? 通常 标准 输入 和 标准 输出 指向 终端 。 解 释 
echostate >> echostate. log 将 发 生 什 么 ”使 用 文件 描述 符 0 有 什么 好 处 呢 ? 


如 果 想 建立 一 个 接收 ppp 连接 的 系统 ,需要 安装 一 个 调制 解 调 器 ,并 且 配 置 串 行 
疾 口 。 串 行 接口 的 终端 驱动 程序 应 该 被 配置 成 能 和 调制 解 调 器 协同 工作 。 阅 读 
文件 /etc/gettydefs Ml/etc/inittab, ^& 3J Unix 如 何 为 在 串 行 线 上 的 登录 定义 终 
端 设置 。 


有 些 Unix 支持 三 种 版 本 的 O_SYNC: 仅 数据 块 . 仅 i- 节 点 和 两 者 都 是 。 为 什么 
需要 确保 以 某 种 方式 写 人 ? 控制 这 3 种 类 型 的 标志 的 名 各 是 什么 ? 


在 一 个 终端 特殊 文件 上 的 读 和 写 的 权限 位 用 来 控制 什么 ? 使 用 tty 确定 你 的 终 
端的 名 字 ,然后 使 用 chmod 000 /dev/yourtty 将 你 的 终端 设置 成 对 你 来 说 也 不 可 


读 。 此 时 发 生 了 什么 情况 ”为 什么 呢 ? 


查看 你 系统 上 的 /dev 目录 ,找到 不 支持 read 操作 的 文件 ,不 支持 write 操作 的 文 
件 以 及 不 支持 lseek 操作 的 文件 。 


在 /dev 中 使 用 ls -1 找到 各 种 设备 的 最 大 数目 和 最 小 数目 。 你 看 到 了 什么 模式 ? 
什么 设备 具有 同样 的 最 大 数目 ? 这 些 设备 有 什么 共同 点 ?” 它们 如 何 区 分 ? 


为 uy 驱动 器 设置 的 4 个 组 命名 。 解 释 每 个 组 的 目的 ,并 在 每 个 组 中 命名 两 


个 位 。 


程序 使 用 tcsetattr 关闭 当前 终端 的 回 显 模式 。 当 那个 程序 存在 ,终端 处 于 无 回 
显 状 态 。 另 一 方面 , 当 程 序 打 开 一 个 文件 并 使 用 fcntl 将 描述 符 置 于 O_APPEND 
模式 ,下 一 个 打开 这 个 文件 的 程序 不 能 获得 自动 添加 模式 。 解 释 这 个 明显 的 不 
一 致 的 地 方 。 


到 终端 的 连接 是 个 正规 的 文件 描述 符 。 你 能 够 使 用 fcntl 为 与 文件 描述 符 的 连接 
设置 O_APPEND 属性 吗 ? 自动 添加 对 设备 来 说 是 什么 意思 ? 


ioctl 和 fent! 间 的 区 别 是 什么 ? 


目录 /dev 包含 文件 /dev/null 和 /dev/zero。 这 些 文件 并 不 是 到 设备 的 连接 ,但 是 
它们 也 并 不 代表 磁盘 文件 。 这 些 文件 是 用 来 做 什么 的 ? 为 什么 它们 是 有 用 的 ? 
你 能 够 在 /dev 目录 中 找到 虚拟 设备 的 其 他 文件 吗 ,就 像 这 两 个 文件 一 样 ? 
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o. 编程 练习 


5. 22 


5.23 


9. 29 


改进 这 章 中 write 的 简单 版 本 。 前 文中 的 版 本 要 求 用 户 输入 设备 文件 名 ,而 且 该 
版 本 并 不 显示 不 同 的 欢迎 用 语 。 编 写 一 个 新 版 本 ,能 够 接受 用 户 名 作为 参数 ,并 
在 屏幕 上 显示 你 想 通信 的 用 户 。 查 看 write 的 标准 版 本 显示 的 内 容 。 

你 的 程序 应 该 可 以 处 理 这 样 的 特殊 情况 : 你 想 聊天 的 人 可 能 没有 登录 。 另 一 方 
面 ,你 想 聊 天 的 人 可 能 登录 了 若干 个 终端 。 


不 想 被 那些 发 送 write 的 人 打扰 的 用 户 可 以 使 用 命令 mesg。 阅 读 mesg, 通 过 程 
序 试验 以 了 解 它 如 何 工 作 , 然 后 写 一 个 这 样 的 程序 。 


通常 的 苋 争 情况 包括 两 个 进程 同时 更 新 同一 个 文件 。 例 如 , 当 你 在 一 些 系 统 上 
修改 你 的 密码 ,程序 passwd 重 写 文 件 /etc/passwd。 如 果 两 个 用 户 同时 修改 他 们 
的 密码 会 怎样 呢 ? 
一 种 防止 对 一 个 文件 进行 同时 访问 的 方法 是 利用 系统 调用 link 的 一 个 重要 性 
质 。 考 虑 以 下 代码 : 
/* 

* tries to make a link called /etc/passwd. LCK 

* returns 0 if ok, 1 if already locked, 2 if other problem 

x / 
int lock_passwd() 
| 


int rv = 0; . /* default return value x/ 
if ( link ("/etc/passwd", "/etc/passwd.LCK") == - 1) 
rv = (errno == EEXISTS ? 1 :2 )， 
return rv; 
) 
(1) 如 果 两 个 进程 在 同一 时 刻 执 行 这 段 代 码 , 只 有 一 个 会 成 功 。 系 统 调用 link 如 
何 使 用 有 效 的 方法 给 文件 上 锁 ? 
(2) 使 用 这 种 方法 编写 一 个 程序 ,将 文本 的 一 行 添加 到 一 个 文件 。 你 的 程序 需要 
尝试 建立 链接 。 如 果 链 接 成 功 ,程序 能 够 打开 文件 ,添加 行 , 然 后 删除 链接 。 
如 有 果 建 立 链接 失败 ,你 的 程序 需要 使 用 sleep(1) 等 待 1 s, 然 后 再 次 尝试 。 你 
需要 确保 你 的 程序 不 会 永远 处 于 等 待 状态 。 
(3) 与 一 个 不 用 lock_passwd 的 unlock_passwd BR. 
(4) 本 例 显示 了 人 允许 进程 给 一 个 已 存在 的 文件 上 锁 , 但 是 如 何 使 用 link 编程 避免 
两 个 进程 创建 同样 的 文件 呢 ? 
(5) 学 习 命 令 vipw。vipw 为 锁 使 用 链接 吗 ? 


前 一 个 问题 显示 了 了 如何 使 用 链接 给 文件 上 锁 。 当 给 文件 上 锁 的 程序 结束 修改 文 
件 时 ,文件 的 锁 必 须 被 删除 。 如 果 程 序 不 释放 锁 , 其 他 的 程序 将 会 永远 处 于 等 待 
状态 。 如 果 程 序 有 漏洞 ,在 它 释 放 锁 之 前 崩溃 ,或 被 用 户 按 下 Ctrl-C 结束 ,将 会 
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9. 26 


9. 27 


9. 28 
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怎样 ? 

一 种 解决 方法 是 拥有 锁 的 程序 每 隔 m 秒 修改 文件 。 程 序 可 以 使 用 utime 去 做 。 
等 待 锁 的 程序 可 查看 修改 时 间 , 检 查 锁 是 否 依 然 有 效 。 如 果 锁 在 上 述 规定 的 间 
隔 中 未 被 修改 ,那么 其 他 的 程序 可 随意 删除 链接 ,然后 再 次 创建 链接 。 

编写 一 个 lock_passwd 的 新 版 本 ,使 之 带 有 表示 秒 数 的 数字 参数 。 这 个 新 版 本 能 
够 实现 上 面 所 描述 的 逻辑 ，。 


如 采 关 闭 缓冲 ,将 会 有 什么 影响 ? 编写 一 个 程序 ,用 来 将 一 个 大 的 磁盘 文件 分 装 
在 小 的 片 里 面 ,例如 2MB 的 文件 被 分 装 在 16 FMA RS. RH O_SYNC 
开局 和 关闭 进行 试验 。 改 变 文件 和 分 片 的 大 小 ,以 查看 它们 如 何 影响 结果 。 


前 文 包含 了 关闭 文件 描述 符 磁盘 缓冲 的 代码 。 编 写 一 个 将 缓冲 重新 开启 的 程序 。 


编写 一 个 称 为 uppercase. c 的 程序 ,用 来 跟踪 终端 驱动 器 里 的 OLCUC 位 ,并 报告 
该 位 的 当前 状态 。 


stty — a 的 输出 包含 终端 窗口 的 行 数 和 列 数 。 这 些 值 不 是 来 自 tcgetattr, 而 是 来 
自 ioctl。 使 用 这 个 系统 调用 修改 第 1 章 的 more, 使 它 能 够 使 用 终端 窗口 的 大 小 
显示 ,而 不 是 固定 值 24。 


6. 项 目 
基于 本 章 的 内 容 , 能 够 了 解 和 编写 以 下 这 些 Unix 程序 : 
write,stty,passwd.wall biff mt( 磁 带 控制 程序 ,可 能 你 的 系统 上 没有 ) 
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概念 与 技巧 

软件 工具 与 用 户 程序 

读 取 和 修改 终端 驱动 程序 的 设置 
终端 驱动 程序 的 模式 

非 阻塞 输入 

用 户 输入 的 超时 

。 对 信号 的 介绍 : Ctrl * C 是 如 何 工作 的 
相关 的 系统 调用 


* fcntl 


* signal 


6.1 软件 工具 与 针对 特定 设备 编写 的 程序 


在 Unix 系统 ,虽然 设备 看 起 来 很 像 磁盘 文件 ,但 是 设备 是 不 同 于 磁盘 文件 的 。 在 第 5 
章 中 已 经 看 到 ,程序 能 对 设备 执行 open、close、read、write 和 lseek 操作 ,但 是 也 已 经 看 到 设 
备 有 相应 的 驱动 程序 ,那些 驱动 程序 包含 许多 与 设备 相关 的 控制 和 属性 。 程 序 如 何 认识 这 
种 双重 性 ? 

1, 软件 工具 : 从 stdin 或 文件 读 入 , 写 到 stdout 

对 磁盘 文件 和 设备 文件 不 加 以 区 分 的 程序 被 称 为 软件 工具 。Unix 系统 有 好 几 百 个 软件 
工具 ,包括 who.ls.sort,uniq.grep.tr 和 du. KF TAMAR 6.1 所 示 的 模型 

软件 工具 从 标准 输入 读 取 字 节 ,进行 一 些 处 理 , 然 后 将 包含 结果 的 字 节 流 写 到 标准 输 
出 。 工 具 发 送 错 误 消息 到 标准 错误 输出 ,它们 也 被 当做 简单 的 字 节 流 来 处 理 。 这 些 文件 描 
述 符 能 够 连接 到 文件 终端、 鼠标 、 光 电 管 ,打印 机 和 管乐器 ; 工具 对 所 处 理 的 数据 的 源 和 目 
的 地 不 做 任何 假设 。 其 他 很 多 程序 也 能 从 命令 行 所 指定 的 文件 中 读 取 数据 。 
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事实 : 大 多 数 进程 
自动 将 前 3 个 文件 
描述 符 打 开 EN 
不 需要 调用 open() 
来 建立 连接 





图 6.1 3 种 标准 文件 描述 符 


这 些 程序 的 输入 和 输出 能 够 被 重 定向 到 任何 类 型 的 连接 上 : 


$ sort > outputfile 
$ sort x — /dev/lp 
$ who | tr '[a- z]' '[A-Z]"' 


2. 特定 设备 程序 : 为 特定 应 用 控制 设备 

其 它 程序 (如 控制 扫描 仪 . 记 录 压 缩 盘 .操作 磁带 驱动 程序 和 拍摄 数码 相片 的 程序 ) 也 能 
同 特定 设备 进行 交互 。 在 本 章 中 将 通过 了 解 最 常见 的 与 特定 设备 相关 的 程序 (通过 终端 与 
人 交互 的 程序 ) 来 探讨 在 写 这 些 程 序 时 用 到 的 概念 和 技术 。 将 这 些 面向 终端 的 程序 称 为 用 
户 程 序 。 

3. 用 户 程序 : 一 种 常见 的 设备 相关 程序 

用 户 程序 的 例子 有 vi emacs, pine, more, lynx, hangman, robots 和 许多 加 利 福 尼 亚 大 学 
伯克利 分 校 编写 的 游戏 程序 中。 这 些 程序 设置 终端 驱动 程序 的 击 键 和 输出 处 理 方 式 。 驱 动 
程序 有 很 多 设置 ,但 是 用 户 程序 常用 到 的 有 

C1) 立即 响应 击 键 事件 

(2) 有 限 的 输入 集 

C3) 输入 的 超时 

(4) 屏蔽 Ctrl-C 

下 面 将 通过 编写 一 个 实现 所 有 这 些 特点 的 程序 来 学 习 这 些 主题 。 


6.2 终端 驱动 程序 的 模式 


首先 讨论 在 前 面 章 节 中 提 到 的 终端 驱动 程序 。 下 面 通过 一 个 简短 的 转换 程序 来 深入 理 
解 设备 驱动 程序 的 细节 ®®. 


D ”这些 程序 的 源 代码 可 以 在 网 上 找到 ,寻找 bsdgames。 
© 可 以 用 tr 命令 做 同样 的 事情 ,但 是 tr 的 GNU 版 本 有 输入 缓冲 ,这 样 用 它 来 做 教学 的 例子 就 不 是 很 好 了 。 
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/x rotate.c : mapa->b, b—»c, -. z—»a 
*  purpose;useful for showing tty modes 


*/ 


# include <stdio. h> 
# include <ctype. h> 


int main() 
( 
int c; 
while ( ( c» getchar() ) ! = EOF ){ 
if(c == 'z') 
C 7 'a'; 


else if (islower(c)) 
CFF 
putchar(c); 


6.2.1 规范 模式 : 缓冲 和 编辑 
使 用 默认 设置 运行 这 个 程序 (<- 是 退 格 键 ) 


$ cc rotate.c - o rotate 
S ./rotate 

abx< - cd . 

bcde 

efgCtrl- C 

$ 


图 6.2 显示 了 终端 、 内 核 、rotate 程序 和 数据 流 。 





Rotate 程序 


6.2 输入 的 内 容 和 程序 所 得 到 的 内 容 
上 述 的 实验 揭示 了 标准 输入 处 理 的 如 下 特征 : 
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(1) 程序 未 得 到 输入 的 “x”, 这 是 因为 退 格 键 删除 了 它 ; 

(2) 击 键 的 同时 字符 显示 在 屏幕 上 ,但 是 直到 按 了 回 车 键 , 程 序 才 接收 到 输入 ; 

(3) Ctrl-C 键 结束 输入 并 终止 程序 。 

程序 rotate 不 做 这 些 操作 。 缓 冲 、 回 显 、 编 辑 和 控制 键 处 理 都 由 驱动 程序 完成 。 图 6.3 
显示 了 驱动 程序 中 的 操作 层次 。 





rotate 程序 


图 6.3 终端 驱动 器 中 的 处 理 层 


缓冲 和 编辑 包含 规范 处 理 (canonical processing) 。 当 这 些 特征 被 启动 ,终端 连接 被 称 为 
处 于 规范 模式 。 


6.2.2 非 规范 处 理 
现在 ,尝试 这 个 试验 (输入 仍旧 是 abx—— cd, 然后 ,输入 efg Ctrl-C): 


$ stty - icanon; . /rotate 
abbcxy^? cdde 
effggh 


$ stty icanon 


命令 stty -icanon 关闭 了 驱动 程序 中 的 规范 模式 处 理 。 上 例 并 没有 展示 非 规范 模式 的 
各 个 侧面 ,而 只 是 演示 了 输入 处 理 方式 被 改变 了 。 

特别 地 , 非 规范 模式 没有 缓冲 。 输 入 字母 “a”, 驱动 程序 跳 过 缓冲 层 ,将 字符 直接 送 到 程 
FF. rotate, 然 后 程序 显示 字符 “b”。 用 户 输入 未 被 缓冲 可 能 是 一 件 麻烦 事 。 当 用 户 试图 删除 
一 个 字符 ,驱动 程序 不 能 做 任何 事情 ; 字符 早 就 送 给 程序 了 ， 

最 后 一 个 试验 ,尝试 以 下 命令 ,然后 再 次 输入 “abx 二 - cd" sl cfg"Ctrl - C, 


$ stty - icanon - echo ; . /rotate 

bcy^? de 

fgh 

$ stty icanon echo (注意 : 你 看 不 到 这 个 。 为 什么 ?) 


在 这 个 例子 中 关闭 了 规范 模式 和 回 显 模式 。 驱 动 程序 不 再 显示 所 输入 的 字符 。 输 出 
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仅 来 自 程序 。 当 退出 这 个 程序 时 ,驱动 程序 仍旧 处 于 无 回 显 、 非 规范 模式 中 ,并 且 一 直 处 
于 那 种 状态 直到 程序 改变 了 设置 。shell 打印 一 个 显示 符 , 等 待 下 一 行 命令 。 有 些 shell 重 
置 驱动 程序 ,而 有 些 不 这 么 做 。 如 果 shell 并 不 重 置 驱动 程序 ,将 继续 处 于 无 回 显 、 非 规范 
的 模式 中 。 


6.2.3 终端 模式 小 结 


如 果 还 未 在 终端 尝试 这 些 例子 ,现在 就 做 。 这 些 例子 演示 了 终端 驱动 程序 的 不 同 模式 ， 
当 为 Unix 设计 用 户 程序 时 ,需要 决定 哪 种 终端 模式 适合 这 个 应 用 。 

l. 规范 模式 

规范 模式 ,也 被 称 为 cooked 模式 ,是 用 户 常见 的 模式 。 驱动 程序 输入 的 字符 保存 在 缓冲 
区 ,并 且 仅 在 接收 到 回 车 键 O 时 才 将 这 些 缓冲 的 字符 发 送 到 程序 。 缓冲 数据 使 驱动 程序 可 以 
实现 最 基本 的 编辑 功能 ,如 删除 字符 .单词 或 整 行 。 当 用 户 分 别 按 下 删除 键 .单词 删除 键 或 
是 终止 键 时 ,这 些 功能 就 会 被 调用 。 钙 指 派 到 这 些 功能 的 特定 键 在 驱动 程序 里 设置 ,可 通过 
命令 stty 或 系统 调用 tcsetattr 来 修改 ，。 

2. 非 规范 模式 

当 缓 冲 和 编辑 功能 被 关闭 时 ,连接 被 称 为 处 于 非 规范 模式 。 终端 处 理 器 仍旧 进行 特定 
的 字符 处 理 , 例 如 ,处 理 Ctrl-C 及 换行 符 和 回 车 符 之 间 的 转换 。 但 是 ,用 于 删除 .单词 删除 
和 终止 的 编辑 键 没有 特殊 的 意义 ,因此 相应 的 输入 被 视 作 常规 的 数据 输入 ， 

如 有 果 用 非 规范 模式 编写 程序 ,并 且 希 望 用 户 能 够 编辑 他 们 的 输入 ,需要 在 你 的 程序 中 实 
现 编辑 功能 。 

3. raw 模式 

每 个 处 理 步骤 都 被 一 个 独立 的 位 控制 。 例 如 ,ISIG 位 控制 Ctrl-C 键 是 否 用 于 终止 一 个 
程序 。 程 序 可 随意 关闭 所 有 这 些 处 理 步 又 。 

当 所 有 处 理 都 被 关闭 后 ,驱动 程序 将 
输入 直接 传递 给 程序 。 在 这 种 情况 下 , 豫 
动 程序 被 称 为 处 于 raw 模式 。 在 终端 驱动 
程序 更 为 简单 的 老 版 本 系统 中 ,有 个 特定 
的 模式 被 称 为 raw 模式 。 命 令 stty 支持 
raw 模式 ,将 它 作为 命令 行 的 一 个 选项 。 联 
机 帮助 上 有 关 stty 的 部 分 解释 了 raw 模式 
的 含义 。 

终端 驱动 程序 是 内 核 中 一 些 复杂 的 程 
序 。 通 过 前 面 的 学 习 和 试验 可 以 更 为 清楚 
地 了 解 它们 的 各 个 组 成 部 分 和 功能 。 图 6. 4 图 6.4 终端 驱动 程序 的 主要 组 成 部 分 
显示 了 其 主要 部 分 。 





O 或 者 是 当前 定义 的 EOF 键 ,通常 为 Ctrl - D, 
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各 种 模式 都 有 各 自 特 定 的 用 途 。 为 了 帮助 理解 这 些 模 式 的 实际 应 用 价值 ,下 面 开 发 了 
一 个 使 用 不 同 模 式 的 用 户 程 序 。 


6.3 编写 一 个 用 户 程序 : play again. c 


很 多 用 户 应 用 程序 ,例如 ,自动 取款 机 和 计算 机 游戏 ,都 会 向 用 户 提出 yes/no 的 问题 。 
以 下 程序 脚本 是 一 个 银行 应 用 程序 的 主 循 环 : 


#1! /bin/sh 
# 
# atm.sh - a wrapper for two programs 
# aS 
while true 
do 
do_a transaction # run a program 
if play again i run our program 
then 
continue H if"y" loop back 
fi 
break # if "n" break 
done 


就 像 其 他 典型 的 Unix 风格 的 程序 ,这 个 银行 脚本 程序 将 程序 的 各 个 组 件 组 合 起 来 。 第 一 
个 组 件 是 一 个 称 为 do a transaction 的 程序 ,完成 ATM 的 工作 。 第 二 个 组 件 play. again, 从 用 户 
那儿 得 到 “是 ”或 “ 否 ” 的 回答 。 下 面 实现 第 二 个 组 件 程 序 。 这 样 的 组 件 架 构 允 许 方便 地 更 换 不 
同 版 本 的 play again, 
play. again. c 的 逻辑 很 简单 . 
。 对 用 户 显示 提示 问题 
。 接受 输入 
© 如 果 是 “y”, 返 回 0 
。 如 果 是 “n”, 返 回 1 


l. 例子 : play again0,c 完成 上 述 功 能 





/* play again0.c 

* purpose: ask if user wants another transaction 
* method: ask a question, wait for yes/no answer 
x returns; 0 --— yes, 1=>no 

* better: eliminate need to press return 
*/ 

tH include <«<stdio. h> 

# include <(termios. h> 


# define QUESTION "Do you want another transaction" 
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int get response( char * ); 


int main() 
1 
int response; 
response = get response(QUESTION); /x get some answer x/ 
return response; 
j 
int get response(char * question) 
/* 
* purpose; ask a question and wait for a y/n answer 
* method: use getchar and ignore non y/n answers 
* returns; 0=>yes, 1=>no 
x/ 
{ 
printf("%s (y/n)?", question); 
while(1) { 
switch( getchar() ) { 
case 'y': 
case 'Y'; return 0; 
case 'n!; 
case 'N': 


case EOF; return 1; 


d 
这 个 程序 显示 提示 问题 ,然后 循环 读 取 用 户 的 输入 ,直到 用 户 输入 了 “y”“n”“Y? 或 
“N” FIFE. play againO 有 两 个 问题 ,这 两 个 问题 都 由 运行 时 处 在 规范 模式 引起 。 首 先 , 用 


户 必 须 按 回 车 键 ,play again0 才能 接受 到 数据 。 第 二 , 当 用 户 按 回 车 键 时 ,程序 接收 整 行 
数据 并 对 其 进行 处 理 。 因 此 ,play_again0 把 下 面 的 输入 作为 一 个 否定 的 回答 。 


$ play againO 


Do you want another transaction (y/n) ? sure thing! 


第 一 个 改进 是 关闭 规范 输入 ,使 得 程序 能 够 在 用 户 敲 键 的 同时 得 到 输入 的 字符 。 
2. 例子 : play againl.c 即时 响应 





/* play againl.c 

* purpose; ask if user wants another transaction 

x method; set tty into char - by - char mode, read char, return result 
* returns; 0-7» yes, 1=>no 

* better: do no echo inappropriate input 

x/ 

# include <stdio.h> 








D ————Á————— ——À——— 
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# include <termios. h> 
# define QUESTION "Do you want another transaction" 


main() 


( 


int . response; 


tty mode(0); /* save tty mode x/ 

set crmode(); /* set chr ~ by - chr mode x/ 
response = get response(QUESTION); /* get some answer */ 

tty mode(1); /x restore tty mode «/ 


return response; 
} 
int get response(char x question) 
/* 
* purpose; ask a question and wait for a y/n answer 
* method: use getchar and complain about non y/n answers 
x returns; 0-7 yes, 1=>no 


*/ 


int input; 
printf("$ s (y/n)?", question); 
while(1)| 
Switch( input = getchar() )( 
case 'y!: 
case 'Y': return 0; 
case 'n'; 
case 'N'; 
case EOF; return 1; 
default: 
printf(" \ncannot understand $c, ", input); 


printf( "Please type y or no \n"); 


set crmode() 
je 
* purpose; put file descriptor 0 (i.e. stdin) into chr - by - chr mode 
x method: use bits in termios 
x/ 
( 
struct termios ttystate; 
tcgetattr( 0, &ttystate); /* read curr. setting x/ 
ttystate.c lflag &= ~ICANON; /* no buffering */ 
ttystate.c cc| VMIN] = 1; /* get 1 char at a time x/ 
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tcsetattr( 0 , TCSANOW, &ttystate); /* install settings «/ 
? 


/x how == 0 => save current mode, how == 1 => restore mode x/ 
tty mode(int how) 
1 


Static struct termios original mode; 
if ( how == 0) 
tcgetattr(0, &original mode); 
else 
return tcsetattr(0, TCSANOW, &original mode); 


play againl 首先 将 终端 置 于 一 个 字符 接着 一 个 字符 的 模式 (character - by - character 
mode) ,然后 幸 用 肾 数 显示 一 个 提示 符 , 并 获得 一 个 响应 ,最 后 设置 终端 为 原始 的 模式 。 注 
意 ,最 后 并 未 将 终端 置 于 规范 模式 。 取 而 代 之 的 是 ,将 原先 的 设置 复制 到 一 个 称 为 original 
mode 的 结构 中 ,结束 时 恢复 这 些 设置 。 

将 终端 置 于 字符 输入 模式 包括 两 部 分 工作 。 除 了 将 ICANON 位 关闭 外 ,还 要 将 值 1 分 
配给 控制 字符 数组 中 以 VMIN 为 下 标的 元 素 。VMIN 的 值 告诉 驱动 程序 一 次 可 以 读 取 和 多少 
个 字符 。 因 为 希望 一 个 接 一 个 地 读 取 字符 ,所 以 将 这 个 值 置 为 1。 如 果 希 望 一 次 读 取 3 个 字 
符 鱼 , 则 可 将 值 置 为 3。 

编译 并 运行 这 个 程序 ,输入 sure 作为 回答 ， 


$ make play againl 

cc play againl.c - o play againi 

$ . /play againl 

Do you want another transaction (y/n)? s 
cannot understand s, Please type y or no 
u 

cannot understand u, Please type y or no 
r 

cannot understand r, Please type y or no 
e 


cannot understand e, Please type y or no 


YS 


像 预期 的 那样 ,play_againl 接收 和 处 理 字符 ,而 不 再 等 待 回 车 键 。 但 是 对 每 个 非法 字符 
都 提示 错误 信息 可 能 让 人 觉得 比较 烦 。 一 个 更 好 的 设计 是 关闭 回 显 模式 ,丢掉 不 需要 的 字 
符 , 直 到 得 到 可 接受 的 字符 为 止 。 


D 实际 上 我 用 这 个 处 理 功 能 键 。 在 很 多 键盘 上 ,功能 键 发 送 多 个 字符 序列 ,例如 escape 表示 - [-l-l~, 4R@# 
BEC escape 字符 (ASCII 27) , 它 期 待 一 次 读 人 一 行 上 的 3 个 或 4 个 字符 。 
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3, 例子 ; play again2.c 忽略 非法 键 


/* play again2.c 
x purpose: ask if user wants another transaction 
x method: set tty into char - by - char mode and no - echo mode 
x read char, return result 
* returns; 0=>yes, 1 =>no 
* better: timeout if user walks away 
x 
x/ 
# include < stdio. h> 
# include < termios. h> 


# define QUESTION "Do you want another transaction" 


main() 
{ 
int response; 
tty mode(0); /* save mode x/ 
set cr noecho mode(); /* set — icanon, - echo «/ 
response - get response(QUESTION); /* get some answer x/ 
tty mode(1); /* restore tty state x/ 
return response; 
j 
int get response(char * question) 
/* 
* purpose; ask a question and wait for a y/n answer 
* method; use getchar and ignore non y/n answers 
x returns; 0 — yes, 1 =>no 


*/ 


printf(" & s (y/n)?", question); 
while(1)( 
switch( getchar() ){ 
case 'y': 
case 'Y': return 0; 
case 'n': 
case 'N': 


case EOF: return 1; 


j 


set cr noecho mode() 
/* 


* purpose; put file descriptor 0 into chr - by - chr mode and noecho mode 
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* method: use bits in termios 
x/ 
( 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr. setting */ 
ttystate.c lflag &= 一 ICANON， /* no buffering */ 
ttystate.c lflag  &- ~ECHO; /* no echo either */ 
ttystate.c cc| VMIN] = 1; /x get 1 char at a time x/ 
tcsetattr( 0 , TCSANOW, &ttystate); /* install settings x/ 

j 

/* how == 0 => save current mode, how == 1 => restore mode x/ 


tty mode(int how) 
{ 
static struct termios original mode; 
if ( how == 0) 
tcgetattr(0, &original mode); 
else 
return tcsetattr(0, TCSANOW, &original mode); 


} 


这 个 程序 和 前 面 的 版 本 在 两 个 方面 有 所 不 同 。 设 置 终 端 驱动 程序 的 函数 关闭 了 回 显 
位 。 注 意 ,恢复 函数 不 需要 特意 将 该 位 开启 。 另 一 个 变化 是 函数 get. response 不 再 提示 错误 
信息 ,而 仅仅 是 忽略 它们 。 

编译 并 运行 这 个 程序 。 如 果 输 入 sure 没有 显示 任何 内 容 。 仅 当 输 入 y 或 n 时 ,程序 
返回 。 

play again2 如 所 希望 的 那样 运行 ,但 是 它 还 有 待 改 进 。 如 果 这 个 程序 运行 在 真正 的 
ATM 上 ,而 顾客 在 输入 y 或 n 之 前 走 开 了 ,将 会 怎样 ? 下 一 个 顾客 跑 过 来 按 下 y, 就 能 进入 
那个 离开 的 顾客 的 账号 。 所 以 如 果 用 户 程序 包含 超时 特征 ,会 变 得 更 安全 ，。 


非 阻塞 输入 : play again3. c 


下 一 个 程序 版 本 含有 超时 特征 。 通 过 设置 终端 驱动 程序 ,使 之 不 等 待 输 入 来 实现 这 个 
特征 。 先 检查 看 是 否 有 输入 ,如 果 发 现 没 有 输入 , 则 先 睡眠 几 秒 钟 ,然后 继续 检查 输入 。 如 
此 尝试 3 次 之 后 放弃 。 

1, 阻塞 与 非 阻塞 输入 

当 调 用 getchar 或 read 从 文件 描述 符 读 取 输 入 时 ,这 些 调用 通常 会 等 竺 输入。 在 play_ 
again 例子 中 ,对 getchar 的 调用 使 得 程序 一 直 等 待 用 户 的 输入 ,直到 用 户 输入 一 个 字符 。 程 
序 被 阻塞 ,直到 能 获得 某 些 字符 或 是 检测 到 了 文件 的 末尾 。 那 么 如 何 关闭 输入 阻塞 呢 ? 

阻塞 不 仅仅 是 终端 连接 的 属性 ,而 是 任何 一 个 打开 的 文件 的 属性 。 程 序 可 以 使 用 fcntl 
或 open 为 文件 描述 符 启 动 非 阻 塞 输入 Cnonblock input), play_again3 使 用 fentl 为 文件 描 








e 164 * Unix/Linux 编程 实践 教程 


述 符 开启 O NDELAY? 标志 。 

关闭 一 个 文件 描述 符 的 阻塞 状态 并 调用 read。 结 果 如 何 呢 ? 如 果 能 够 获得 输入 ,read 
获得 输入 并 返回 所 获得 的 字符 个 数 。 如 果 没 有 输入 字符 ,read 返回 0, 这 就 像 遇 到 文件 末尾 
. 一样。 如 果 有 和 错误 ,read 返回 一 1。 

非 阻塞 操作 的 内 部 实现 相当 简单 。 每 个 文件 都 有 一 块 保存 未 读 取 数据 的 地 方 , 如 图 6. 4 
所 示 的 驱动 程序 里 最 顶端 的 存储 方块 。 如 果 文 件 描述 符 置 了 O_NDELAY 位 ,并 且 那 块 空间 
是 空 的 ,read 调用 返回 0。 如 果 能 阅读 与 O_NDELAY 有 关 的 的 Linux 源 代 码 , 就 可 以 了 解 
到 实现 的 细节 。 


2. 例子 : play again3.c 使 用 非 阻 赛 模式 实现 超时 响应 





/* play again3.c 
* purpose; ask if user wants another transaction 
* method; set tty into chr ~ by - chr, no- echo mode 
* set tty into no- delay mode 
x read char, return result 
* returns; 0=>yes, 1 =>no, 2 =>timeout 
* better; reset terminal mode on Interrupt 
x/ 
# include <stdio.h> 
# include <ctermios. h> 
# include <fentl. h> 
# include <string. h> 


#define ASK "Do you want another transaction" 


# define TRIES 3 /* max tries x/ 

# define SLEEPTIME 2 /x time per try «/ 
i define BEEP putchar('\a') /* alert user x/ 
main() 


( 


int response; 


tty mode(0); /* save current mode x/ 
set cr noecho mode(); /x set 一 icanon, - echo x/ 
set nodelay mode(); /x noinput => EOF «/ 
response = get response(ASK, TRIES); /x get some answer «/ 

tty mode(1); /* restore orig mode x / 


return response; 


} 


get response( char x question , int maxtries) 


/x 


* purpose; ask a question and wait for a y/n answer or maxtries 


O 也 可 以 使 用 O_NONBLOCK 位 ,请 查阅 联机 帮助 。 
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x method: use getchar and complain about non y/n input 


* returns; 0 —» yes, 1-7»no, 2 -— timeout 


x/ 
{ 
int input; 
printf("%s (y/n)?", question); /x ask «/ 
fflush(stdout); /* force output x/ 
while ( 1 ){ 
sleep( SLEEPTIME) ; /x wait a bit */ 
input - tolower(get ok char()); /* get next chr x/ 
if ( input == 'y') 
return 0; 
if ( input == 'n' ) 
return 1; 
if ( maxtries-- == 0) /* outatime? x/ 
return 2; /* sayso */ 
BEEP; 
} 
} 
/* 


* skip over non- legal chars and return y,Y,n,N or EOF 
x/ 
get ok char() 
int c; 
while( ( c = getchar() ) 1= EOF && strchr("yYnN",c) == NULL ) 
return c; 
) 
set cr noecho mode() 
/* 
* purpose: put file descriptor 0 into chr - by - chr mode and noecho mode 
x method: use bits in termios 
{ 


struct termios ttystate; 


tcgetattr( 0, &ttystate); /* read curr. setting */ 
ttystate.c lflag &= --ICANON; /* no buffering x/ 
ttystate.c lflag &= --ECHO; /* no echo either x/ 
ttystate.c cc[ VMIN) - 1; /* get 1 char at a time x/ 
tcsetattr( 0 , TCSANOW, &ttystate); /* install settings x/ 


} 
set nodelay mode() 


/* 
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* purpose: put file descriptor 0 into no- delay mode 
x method: use fcntl to set bits 


* notes; tcsetattr() will do something similar, but it is complicated 


*/ 


int termflags; 


termflags = fcntl(0, F GETFL); /* read curr. settings x/ 
termflags | - O NDELAY; /* flip on nodelay bit x/ 
fcntl(0, F SETFL, termflags); /* and install tem «/ 

j 

/* how == 0 => save current mode, how == 1 => restore mode x/ 


/x this version handles termios and fcntl flags x/ 
tty mode(int how) 
( 
static struct termios original mode; 
static int original flags; 
if ( how == 0 ){ 
tcgetattr(0, &original mode); 
original flags = fcntl(0, F_GETFL); 
} 
else { 
tcsetattr(0, TCSANOW, &original mode); 
fcntl( 0, F SETFL, original flags); 
j 
j 


程序 的 这 个 版 本 有 一 些 新 特点 。 首 先 使 用 fcntl 关闭 和 开启 非 阻 塞 模式 ,其 次 在 get 
response 中 使 用 sleep 和 计数 器 maxtries。 

3. play again3 的 小 问题 

play again3 并 不 是 理想 的 。 运 行 在 非 阻 塞 模式 ,程序 在 调用 getchar 给 用 户 输入 字符 之 
前 睡眠 2s。 就 算 用 户 在 1s 内 完成 输入 ,程序 也 要 在 2s 后 才 得 到 字符 。 用 户 可 能 会 感到 迷 
感 :“ 我 不 是 输入 了 吗 ” 怎 么 没 反 映 呢 ? 难道 说 我 弄 错 了 ?” 

可 以 使 程序 更 快 地 做 出 响应 吗 ? 可 以 减少 每 次 调用 getchar 间 的 睡眠 时 间 , 并 相应 地 增 
加 循环 次 数 来 实现 相同 的 超时 设置 。 

男 外 ,注意 在 显示 提示 符 之 后 对 fflush 的 调用 。 如 果 没 有 那 一 行 ,在 调用 getchar 之 前 ， 
提示 符 将 不 能 显示 。 究 其 原因 是 ,终端 驱动 程序 不 仅 一 行 行 地 缓冲 输入 ,而 且 还 一 行 行 地 组 
冲 输出 。 驱 动 程序 缓冲 输出 ,直到 它 收 到 一 个 换行 符 或 者 程序 试图 从 终端 读 取 输入 。 在 这 
个 例子 中 ,为 了 给 用 户 读 提示 符 的 时 间 ,需要 延迟 读 人 。 这 样 就 必须 调用 fflush, 

4. 实现 超时 的 其 他 方法 

Unix 提供 更 好 的 方法 来 实现 超时 功能 ,在 驱动 程序 中 设置 数组 c_cc[] 中 的 元 素 VTIME 


将 超时 功能 的 实现 移 至 终端 驱动 程序 。 本 章 的 一 个 练习 提供 了 相关 细节 。 系 统 调 用 select 


包含 一 个 超时 参数 。 将 在 后 面 的 章节 中 讨论 select, 
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5. play again3 的 一 个 大 问题 
play again3 忽略 它 所 不 想 要 的 字母 ,识别 和 处 理 合 法 输入 ,并 在 规定 的 时 间 间 隔 内 无 合 
法 输入 的 情况 下 自动 退出 。 但 是 如 果 用 户 输 入 Ctrl-C 将 会 如 何 ? 下 面 是 它 的 运行 情况 : 


$ make play again3 

cc play again3.c - o play again3 

$ . /play again3 

Do you want another transaction (y/n)? press Ctrl - C now 
$ logout 

Connection to host closed. 


bashs 


当 按 下 Ctrl-C 终止 程序 play_again, 不 但 终止 了 这 个 程序 ,同时 也 终止 了 整个 登录 会 
话 。 这 是 为 什么 呢 ? play_again3 有 3 TER: 初始 化 、 获 得 用 户 输 入 和 恢复 设置 ,如 在 图 6.5 
中 描述 的 那样 。 


| 设置 O NDELAY 
初始 控制 流 设置 crmode 


| 
^N 显示 提示 符 。。 当 读 取 终 止 时 的 流向 
等 待 用 户 输入 
"P m — — — — — a — 进程 被 终止 
用 户 输入 


| 恢复 tty 设置 





进程 正常 退出 时 的 流向 -| POE fon Be 
退出 
进程 正常 退出 
图 6.5 Ctrl-C 终 止 进程 并 将 终端 置 于 未 恢复 状态 


初始 化 部 分 将 终端 置 于 非 阻塞 输入 状态 。 程 序 随 后 进入 主 循环 并 打印 提示 ,睡眠 和 读 
取 输 入 。 然 后 在 程序 运行 中 通过 按 Ctrl ~ C 键 来 终止 程序 。 那 么 终端 驱动 程序 处 于 什么 
状态 ? 

实际 上 程序 会 立刻 退出 ,而 不 执行 重 置 驱动 程序 的 代码 。 当 返回 shell 显示 提示 符 并 从 
用 户 处 获得 命令 行 时 ,终端 仍旧 处 于 非 阻 塞 模式 。shell 调用 read 获取 命令 行 ,但 是 因为 处 
于 非 阻 塞 状态 ,read 立即 返回 0。 总 之 ,程序 结束 时 文件 描述 符 处 于 一 个 错误 的 状态 。 下 一 
个 目标 是 学 习 如 何 避 免 程序 被 Ctrl-C BSE HAZE. 

6. 为 什么 有 些 情况 下 不 会 被 注销 ? 

很 多 Unix shell 包含 编辑 特征 ,如 使 用 箭头 键 在 执行 过 的 命令 列表 中 滚动 。 这 些 shell 
运行 在 实现 这 些 功 能 所 需要 的 raw 模式 下 。 当 程序 退出 或 死亡 时 , 像 bash 和 tesh 这 些 shell 
立即 重 置 终端 的 属性 。 
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6:4 dE 


Ctrl-C 中 断 当 前 运行 的 程序 。 这 个 中 断 由 一 个 称 为 信号 的 内 核 机 制 产 生 。 信 和 号 是 一 个 
简单 而 重要 的 概念 。 下 面 将 探讨 信号 的 基本 概念 ,学 习 怎 样 使 用 它们 解决 play_again3 的 问 
题 。 在 下 一 章 中 将 更 深入 地 学 习 信 号 。 


6.4.1 Ctrl 一 C 做 什么 


输入 Ctrl-C, 程 序 便 被 终止 了 。 一 个 单一 的 击 键 是 如 何 杀 死 一 个 进程 的 呢 ? 终端 驱动 
程序 在 这 里 起 了 相应 的 作用 , 图 6.6 显示 了 相应 的 事件 链 。 


. 用户 输 入 Ctrl- C 
. 驱动 程序 收 到 字符 

.匹配 VINTR 和 ISIG 的 字符 被 开启 
.驱动 程序 调用 信号 系统 

. 信号 系统 发 送 SIGINT 到 进程 

. 进程 收 到 SIGINT 

.进程 消亡 








N-O 一 





a 2 
信号 系统 终端 驱动 程序 


Ctrl - C 


图 6.6 Ctrl-C 如 何 工作 


中 断 信 号 的 击 键 组 合 不 一 定 非 是 Ctrl -C, 可 以 使 用 stty( 或 者 tcsetattr) 将 当前 的 
VINTR 控制 字符 替换 成 另 一 种 键 。 


6.4.2 信号 是 什么 


按 下 Ctrl-C 产生 一 个 信号 ,那么 信号 是 什么 呢 ? 信号 是 由 单个 词组 成 的 消息 。 绿 灯 是 
一 个 信号 ,停止 标牌 是 一 个 信号 ,裁判 手势 也 是 一 个 信号 。 这 些 物体 和 事件 不 是 消息 , 走 、 停 
和 出 界 才 是 消息 。 当 按 Ctrl-C 时 ,内 核 向 当前 正在 运行 的 进程 发 送 中 断 信 号 。 每 个 信号 都 
有 一 个 数字 编码 。 中 断 信号 通常 是 编码 2.9 

信号 从 哪里 来 ? 信号 来 自 内 核 ,生成 信号 的 请 求 来 自 3 个 地 方 ,如 图 6.7 所 示 。 

(1) HP 

用 户 能 够 通过 输入 Ctrl-C、Ctrl-\, 或 是 终端 驱动 程序 分 配给 信号 控制 字符 的 其 他 任何 
键 来 请 求 内 核 产 生 信和 号 。 

(2) Wf 

当 进 程 执行 出 错时 ,内 核 给 进程 发 送 一 个 信号 ,例如 ,非法 段 存 取 、 浮 点 数 溢出 ,或 是 一 


QD 若 改变 它 , 许 多 shell 脚本 将 出 问题 。 
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图 6.7 信和 号 的 3 种 来 源 


个 非法 的 机 器 指令 。 内 核 也 利用 信号 通知 进程 特定 事件 的 发 生 。 

(3) 进程 

一 个 进程 可 以 通过 系统 调用 kill 给 男 一 个 进程 发 送信 和 号。 一 个 进程 可 以 和 另 一 个 进程 
通过 信和 号 通信 。 

由 进程 的 某 个 操作 产生 的 信号 被 称 为 同步 信和 号 (synchronous signals) ,例如 ,被 零 除 。 
由 像 用 户 击 键 这 样 的 进程 外 的 事件 引起 的 信号 被 称 为 异步 信号 (asynchronous signals) 。 

哪里 可 以 找到 信和 号 的 列表 ? 信号 编号 以 及 它们 的 名 字 通 常 出 现在 /usr/include/signal. h 
文件 中 。 这 里 是 这 个 文件 的 一 部 分 ， 


# define SIGHUP 1 /* hangup, generated when terminal disconnects x/ 

# define SIGINT 2 /* interrupt, generated from terminal special char x/ 
# define SIGQUIT 3 /* ( * ) quit, generated from terminal special char «/ 
#define SIGILL 4 /* ( * ) illegal instruction (not reset when caught) x/ 
# define SIGTRAP 5 /* ( * ) trace trap (not reset when caught) x/ 

i define SIGABRT 6 /* ( * ) abort process x/ 

# define SIGEMT 7 /* ( * ) EMT instruction x/ 

# define SIGFPE 8 /* ( * ) floating point exception */ 

# define SIGKILL 9 /* kill (cannot be caught or ignored) x/ 

# define SIGBUS 10 /x (*) bus error (specification exception) x/ 

+ define SIGSEGV 11 /* ( * ) segmentation violation x / 

# define SIGSYS 12 /x ( *) bad argument to system call x/ 

t define SIGPIPE 13 /x writeona pipe with no one to read it x/ 

t define SIGALRM 14 /x alarm clock timeout x/ 

# define SIGTERM 15  /* software termination signal x/ 


例如 ,中 断 信号 被 称 为 SIGINT, 退出 信号 被 称 为 SIGQUIT, ,非法 段 存 取信 和 号 是 


SIGSEGV。 任 何 一 个 版 本 的 Unix 的 手册 都 包含 更 多 的 相关 信息 。 在 Linux 中 ,可 以 查看 
signal(7) 的 相关 联机 帮助 。 | 

信号 做 什么 ? 这 要 视 情 况 而 定 。 很 多 信和 号 杀 死 进程 ， 某 时 刻 进程 还 在 运行 ,下 一 秒 它 
就 消亡 了 ,从 内 存 中 被 删除 ,相应 的 所 有 的 文件 描述 符 被 关闭 ,并 且 从 进程 表 中 被 删除 、 使 
用 SIGINT 消灭 一 个 进程 ,但 是 进程 也 有 办 法 保护 自 己 不 被 杀 死 。 
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6.4.3 进程 该 如 何 处 理 信 号 


当 进 程 接收 到 SIGINT 时 ,并 不 一 定 非 要 消亡 。 进 程 能 够 通过 系统 调用 signal 告诉 内 
核 , 它 要 如 何 处 理 信号 。 进 程 有 和 3 个 选择 。 

(OD 接受 默认 处 理 ( 通 常 是 消亡 ) 

手册 上 列 出 了 对 每 个 信号 的 默认 处 理 。SIGINT 的 默认 处 理 是 消亡 。 进 程 并 不 一 定 要 
使 用 signal 接受 默认 处 理 ,但 是 进程 能 够 通过 以 下 调用 来 恢复 默认 处 理 : 


signal (SIGINT, SIG DFL); 


(2) 忽略 信和 号 
程序 可 以 通过 以 下 调用 来 告诉 内 核 , 它 需要 忽略 SIGINT 信和 号: 


signal (SIGINT, SIG IGN); 


(3) 调用 一 个 函数 

第 3 种 选择 是 3 个 当中 最 强大 的 一 种 。 考 虑 play again3 这 个 例子 。 当 用 户 输入 Ctrl- 
C ,当前 运行 的 程序 立即 退出 ,而 不 调用 恢复 驱动 程序 设置 的 函数 。 更 好 的 做 法 是 ,程序 在 接 
收 到 SIGINT 后 ,调用 一 个 恢复 设置 的 函数 ,然后 再 退出 。 

再 用 signal 的 第 3 种 选择 允许 这 种 类 型 的 响应 。 程 序 能 够 告诉 内 核 , 当 信和 号 到 来 时 应 该 
调用 哪个 图 数 。 在 信号 到 来 时 被 调用 的 函数 被 称 为 信号 处 理 函 数 。 为 安装 信号 处 理 函 数 ， 
程序 调用 : 


signal (signum, functionname); 

















signal 
目标 简单 的 信号 处 理 
头 文 件 # include «signal. h> 
ER Ar J BY result — signal (int signum, void ( x action) (int) ; 
signum 需 啊 应 的 信息 
参数 action Ji rf ns] Ay 
— j H ^ 
返回 什 过 到 错误 


prevaction 成功 返还 
-一 U 
调用 signal 为 编码 是 signum 的 信和 号 安装 新 的 信号 处 理 函 数 。action 可 以 是 函数 名 或 以 
下 两 个 特殊 值 之 一 。 
。 SIG_IGN, 忽略 信和 号; 
* SIG_DFL, 将 信号 恢复 为 默认 处 理 。 
signal 返回 前 一 个 处 理 函 数 。 值 是 指向 函数 的 指针 。 
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6.4.4 信号 处 理 的 例子 


1. 捕捉 信号 


/* sigdemol.c - shows how a signal handler works. 
* — run this and press Ctrl - C a few times 
x/ 

# include <stdio.h> 

# include < signal. h> 


main() 

{ 
void f(int) ; /* declare the handler */ 
int i; 
signal( SIGINT, f ); /* install the handler «/ 


for(i-0;i«5;1T)[ /* do something else «/ 
printf("hello\n") ; 
sleep(1); 


} 
void f(int signum) /* this function is called */ 


{ 
printf("OUCH| Mn"); 
j 


主 函 数 由 两 部 分 组 成 ,调用 signal 后 进入 一 个 循环 。sigdemol. c 调用 signal 来 设置 
SIGINT 的 处 理 函 数 f。 如 果 进 程 接收 到 SIGINT 信号 ,内 核 会 调用 函数 {来 处 理 这 个 信号 。 
程序 跳 转 到 那个 函数 ,执行 它 的 代码 ,然后 返回 到 跳 转 前 的 位 置 ,就 像 子 过 程 调 用 一 样 。 

图 6.8 显示 了 两 个 独立 的 控制 流 : 一 个 是 正常 的 路 径 , 进 入 main, 执行 循环 ,然后 从 
main 返回 ; 另 一 个 是 由 信和 号 引起 的 路 径 HAL ABE. 


SIGINT 的 到 达 将 控制 流转 向 信号 
| 处 理 器 。 从 信号 处 理 器 返回 后 继续 
| 一 一 正常 控制 流 执行 原来 的 控制 流 。 
信号 处 理 流程 





图 6.8“ 信 和 号 引起 子 过 程 的 调用 
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以 下 是 程序 运行 情况 : 


$ . /sigdemol 

hello 

hello press Ctrl - C now 

OUCH! 

hello press Ctrl — C now 

OUCH! 

hello 

hello 

$ 

试 编译 并 运行 这 个 程序 。 程 序 中 没有 对 的 显 式 调用 。 接 受到 的 信号 引发 了 对 那个 函 

数 的 调用 。 

2. 忽略 信号 

/x sigdemo2.c - shows how to ignore a signal 
x — press Ctrl- \ to kill this one 
x/ 


# include <stdio.h> 
# include < signal. h> 


main() 
{ 
signal( SIGINT, SIG IGN ); 
printf("you can't stop me! Mn"); 
while( 1 ) 
{ 
sleep(1) ; 
printf("haha\n") ; 


} 


sigdemo2. c 调用 signal 来 设置 为 忽略 中 断 信 号 。 可 以 随意 的 按 Ctrl - C 而 不 会 对 进程 
产生 影响 。 
signal(SIGINT，SIG_IGN) 的 效果 如 图 6. 9 所 示 。 






进程 告诉 内 核 需 要 忽略 SIGINT 


Sigdemo2 


图 6.9 signal (SIGINT, SIG_IGN) 的 效果 
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以 下 是 程序 的 运行 情况 : 


S ./sigdemo2 

you can't stop me! 

haha 

haha 

haha press Ctrl - C now 
haha press Ctrl — C nowpress Ctrl - C now 
haha 

haha 

haha press *\now 

Quit 

$ 


按键 组 合 Ctrl -\ 会 发 送 一 个 不 同 的 信号 , 即 quit 信号 ,这 个 程序 没有 忽略 或 捕捉 
SIGQUIT. 


6.5 为 处 理 信 号 做 准备 : play_again4. c 


现在 已 经 知道 如 何 修改 play again3. c 来 处 理 信 号 ,但 是 还 需要 做 一 个 设计 决策 。 需 要 
忽略 信和 号 并 让 用 户 回 答 yes 或 no 吗 ? 要 捕捉 键盘 信号 吗 ? 当 用 户 输入 no 时 ,要 直接 退出 还 
是 先 返 回 一 个 值 表示 程序 已 经 消亡 ? 

下 面 这 个 程序 版 本 捕捉 SIGINT, 重 置 驱动 程序 ,然后 返回 no 的 代码 。 


/* play again4.c 
* purpose; ask if user wants another transaction 


* method; set tty into chr - by - chr, no- echo mode 


x set tty into no - delay mode 
x read char, return result 
resets terminal modes on SIGINT, ignores SIGQUIT 


* returns; 0=>yes, 1=>no, 2 =>timeout 


* better; reset terminal mode on Interrupt 


x/ 
it include <{stdio. h> 
+ include <_termios. h> 
# include <{fentl. h> 
# include <Istring. h> 
# include < signal. h> 
#define ASK "Do you want another transaction” 
# define TRIES 3 /* max tries x/ 
# define SLEEPTIME 2 /* time per try x/ 


Hd define BEEP putchar('\a') /* alert user x/ 
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main() 


int response; 


void ctrl c handler(int); 


tty mode(0); 

set cr noecho mode(); 

set nodelay mode(); 

signal( SIGINT, ctrl c handler 5; 


/* save current mode x/ 

/* set 一 icanon, ~ echo */ 
/* noinput => EOF «/ 

/x handle INT «/ 


signal( SIGQUIT, SIG IGN ); /* ignore QUIT signals x/ 
response = get response(ASK, TRIES); /* get some answer x/ 
tty mode(1); /* reset orig mode «/ 


return response; 


j 


get response( char x question , 
/* 


* purpose; ask a question and wait for a y/n answer or timeout 


int maxtries) 


* method: use getchar and complain about non- y/n input 
* returns; 0-7 yes, 1=>no | 
*/ 

{ 


int input; 


printf(" & s (y/n)?", question); /* ask x/ 
fflush(stdout); /* force output */ 
while ( 1 ){ 
sleep(SLEEPTIME) ; /* wait a bit «/ 
input = tolower(get ok char()); /* get next chr */ 
if (C input == 'yr) 
return 0; 
if ( input == 'n! ) 
return 1; 
if ( maxtries-- == 0) /* outatime? x/ 
return 2; /* Sayso */ 
BEEP ， 
} 
} 
/* 
* skip over non- legal chars and return y,Y,n,N or EOF 
x/ 


get ok char() 
( 
int C; 


while( ( c = getchar() ) !- EOF && strchr("yYnN",c) == NULL ) 


* 
Li 
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return C; 
j 
set cr noecho mode() 
/* | 
* purpose; put file descriptor 0 into chr - by - chr mode and noecho mode 
* method: use bits in termios 
x*/ 
| 


struct termios ttystate; 


tcgetattr( 0 &ttystate); /* read curr. setting x/ 
ttystate.c lflag &= ~JICANON; /x no buffering x/ 
ttystate.c lflag &= --ECHO; /* no echo either x/ 
ttystate.c cc[VMIN] = 1; /* get 1 char at a time x/ 


tcsetattr( 0 , TCSANOW, &ttystate); /* install settings x/ 
j 


set nodelay mode() 

/* 
* purpose: put file descriptor 0 into no- delay mode 
x method: use fcntl to set bits 


* notes; tcsetattr() will do something similar, but it is complicated 


*/ 


int termflags: 


termflags = fcntl(0, F GETFD); /* read curr. settings x/ 
termflags | = O NDELAY; /x flip on nodelay bit x/ 
fcntl(0, F SETFL, termflags); /* and install 'em x / 
} 
/* how == 0 => save current mode, how == 1 => restore mode x/ 
/* this version handles termios and fcntl flags x / 


tty mode(int how) 

{ 
static struct termios original mode; 
static int original flags; 


static int stored = 0; 


if ( how == 0 ){ 
tcgetattr(O, &original mode); 
original flags = fcntl(0, F_GETFL); 
stored = 1; 
} 
else if ( stored ) { 
tcsetattr(0, TCSANOW, &original mode); 


fcntl( 0, F SETFL, original flags); 
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} 
} 
void ctrl c handler(int signum) 
/* 
* purpose: called if SIGINT is detected 
* action; reset tty and scram 
x/ 
1 
tty mode(l); 
exit(1); 
j 


其 他 的 设计 留 作 练习 。 
6.6 进程 终止 


程序 使 用 signal 来 告诉 内 核 它 需要 忽略 哪 些 信 号 。 如 果 有 人 编写 了 一 个 将 所 有 类 型 的 
信号 设置 为 SIG_IGN 的 程序 ,然后 执行 一 个 无 限 循环 将 会 如 何 呢 ? 

们 好 ,对 系统 管理 员 ( 和 程序 员 ) 来 说 ,Unix 不 可 能 让 一 个 程序 永 不 停止 。 有 两 个 信号 是 
不 能 被 忽略 和 捕 提 的 。 阅 读 手册 或 头 文件 中 的 信号 列表 ,看 看 哪些 信号 是 不 可 阻挡 的 。 


6.7 为 设备 编程 


现在 已 经 了 解 了 编写 终端 控制 程序 的 三 个 方面 。 首 先 ,学 习 了 了 驱动 程序 的 属性 和 如 何 
控制 连接 。 然 后 ,学 习 了 应 用 程序 的 特定 需求 ,并 调整 驱动 程序 以 满足 这 些 需 求 。 最 后 ,学 
习 了 如 何 处 理 信 号 一 一 中 断 的 一 种 形式 。 

这 三 个 方面 对 所 有 的 设备 都 适用 。 考 虑 一 块 声卡 或 一 个 磁盘 驱动 程序 。 设 备 有 许多 种 
由 设备 驱动 程序 控制 的 设置 , 需要 了 解 这 些 设置 。 同 样 ,程序 必须 实现 特定 的 功能 ,调整 驱 
动 程序 以 满足 这 些 需求 。 最 后 ,很 多 设备 驱动 程序 会 产生 信号 报告 错误 或 特定 事件 。 磁 盘 
驱动 程序 可 能 在 它 结束 从 磁盘 到 内 存 数据 块 的 复制 时 发 送 一 个 信和 号 , 程序 必须 能 够 对 这 些 
言 号 做 出 啊 应 。 


小 zi 


1. 主要 内 容 

。 有 些 程序 处 理 从 特定 设备 来 的 数据 。 这 些 与 特定 设备 相关 的 程序 必须 控制 与 设备 的 
连接 。Unix 系统 中 最 常见 的 设备 是 终端 。 

。 终端 驱动 程序 有 很 多 设置 。 各 个 设置 的 特定 值 决 定 了 终端 驱动 程序 的 模式 。 为 用 户 
编写 的 程序 通常 需要 设置 终端 驱动 程序 为 特定 的 模式 。 

© 键盘 输入 分 为 3 类 ,终端 驱动 程序 对 这 些 输入 做 不 同 的 处 理 。 大 多 数 键 代表 常规 数 
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据 ,它们 从 驱动 程序 传输 到 程序 。 有 些 键 调 用 驱动 程序 中 的 编辑 函数 。 如 果 按 下 删 
除 键 ,驱动 程序 将 前 一 个 字符 从 它 的 行 缓冲 中 删除 ,并 将 命令 发 送 到 终端 屏幕 ,使 之 
从 显示 胡 中 删除 字符 。 最 后 ,有 些 键 调用 处 理 控制 水 数 。Ctrl-C 键 告 诉 驱动 程序 调 
用 内 核 中 某 个 函数 ,这 个 函数 给 进程 发 送 一 个 信和 号。 终端 驱动 程序 支持 若干 种 处 理 
控制 函数 ,它们 都 通过 发 送信 号 到 进程 来 实现 控制 。 

* 信和 号 是 从 内 核发 送 给 进程 的 一 种 简短 消息 。 信 和 号 可 能 来 自用 户 、 其 他 进程 或 内 核 本 
身 。 进 程 可 以 告诉 内 核 ,在 它 收 到 信号 时 需要 做 出 怎样 的 响应 。 

2. 进一步 的 问题 


必须 处 理 这 些 输入 。Unix 系统 同时 运行 若干 个 程序 。 内 核 如 何在 同一 时 刻 维护 多 个 并 发 的 
任务 并 对 多 个 不 可 预知 的 中 斯 作出 响应 呢 ? 下 一 章 将 通过 编写 一 个 计算 机 游戏 程序 来 探讨 
这 个 问题 。 
3. 习题 
6.1 很 多 Unix 软件 工具 从 命令 行 指定 的 文件 中 读 取 数据 。 命 令 tr 不 是 这 样 。tr 是 用 
来 干什么 的 ? 能 想 出 它 不 接受 命令 行 指定 文件 名 的 原因 吗 ? 还 有 其 他 仅 从 标准 
输入 读 取 数据 而 不 从 指定 的 文件 中 读 取 数据 的 Unix 工具 吗 ? 大 多 数 的 Unix f 
令 存 储 在 /bin、/usr/bin 和 /usr/local/bin 目录 中 。 


6.2 任何 文件 描述 符 都 有 O_NDELAY 这 个 属性 ,而 不 仅仅 是 终端 驱动 程序 的 属性 。 
这 意味 着 这 个 属性 适用 于 磁盘 文件 ,也 适用 于 设备 文件 。 
对 磁盘 文件 来 说 , 非 阻塞 性 意味 着 什么 ? 除了 终端 文件 , 非 阻 塞 性 对 设备 意味 着 
什么 ? 


4. 编程 练习 

6.3 文件 描述 符 可 能 处 于 阻塞 或 无 延迟 ( 即 非 阻塞 ) 模 式 。 终 端 驱动 程序 提供 了 其 他 
选择 , 它 允 许 对 输入 设置 超时 间隔 。 驱 动 程序 termios 结构 体 中 的 控制 字符 数组 c 
cc EME VTIME 的 元 素 是 用 来 设置 以 毫秒 为 单位 的 超时 间隔 。 因 此 ,s. c_ce 
L VTIME] = 20 会 将 驱动 程序 的 超时 设置 为 s. 
改写 play_again3.c, 使 得 它 使 用 驱动 程序 中 的 超时 特征 ,而 不 再 将 文件 描述 符 置 
于 非 阻 塞 模式 。 


6.4 在 play again 中 处 理 信 和 号 。 
(1) 修改 play_again3. c, 使 得 它 忽略 键盘 信号 ,而 仅 对 yes 或 no 做 出 响应 。 
(2) 修改 play again3. c, 使 得 它 在 收 到 键盘 信号 后 , 重 置 终端 属性 并 以 返回 值 2 退 
tH | 


6.5 修改 rotate. c, 使 得 它 能 够 改变 tty 的 模式 。 修 改过 的 程序 应 该 关闭 规范 模式 ,并 
且 关 闭 回 显 。 然 后 它 读 取 字 符 并 显示 字母 表 中 的 下 一 个 字母 。 当 用 户 按 下 字母 
“Q 时 ,程序 应 该 恢复 tty 设置 并 退出 。 | 
你 的 程序 应 该 忽略 键盘 信号 或 通过 在 退出 之 前 重 置 驱动 程序 来 对 它们 进行 处 理 。 
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6.6 


6.8 


6.9 


6. 10 
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编写 一 个 行 编辑 器 。 编 写 运行 在 非 规 范 模式 程序 的 一 个 问题 是 缺乏 输入 编辑 。 
修改 纠正 过 的 rotate. c, 使 之 支持 字符 和 行 编辑 。 特 别 地 , 当 程序 收 到 一 个 退 格 或 
删除 字符 时 , 它 从 屏幕 上 删除 前 一 个 字符 。 为 删除 一 个 字符 ,程序 需要 打印 一 个 
退 格 字 符 .一 个 空格 字符 ,然后 又 一 个 退 格 字符 。 

同时 ,修改 程序 ,使 得 它 能 够 像 终端 驱动 程序 那样 处 理 行 删 除 字 符 。 也 就 是 ,从 愤 
幕 上 删除 当前 输入 行 的 所 有 字符 。 

需要 做 什么 以 实现 驱动 程序 的 单词 删除 功能 呢 ? 


修改 程序 sigdemol. c, 使 得 它 能 够 对 用 户 按 下 的 Ctrl - C 个 数 进行 计数 。 修 改过 
的 程序 将 显示 OUCH! ,然后 OUCH11, 即 感叹 号 的 个 数 和 处 理 函 数 被 调用 的 次 数 
相等 。 

除了 显示 递增 的 感叹 号 ,程序 应 该 能 够 接受 一 个 整数 作为 命令 行 参数 。 在 用 户 按 
F Ctrl - C 的 次 数 与 那个 整数 相等 之 后 ,程序 应 该 退出 。 


修改 程序 sigdemol. c, 使 得 它 能 够 询问 用 户 是 否 真 的 要 终止 程序 。 运 行 的 样 例如 
下 所 示 : 
hello 
hello 
Interrupted! OK to quit (y/n)? n 
hello 
hello 
Interrupted! OK to quit (y/n)? y 
$ 
如 采 当 程序 在 等 待 用 户 回答 OK to quit (y/n)? 问题 时 ,用 户 按 下 Ctrl - C 将 会 发 
生 什 么 事 ? 实现 上 述 程序 ,并 观察 发 生 的 现象 。 


程序 能 够 使 用 signal 告诉 内 核 它 需要 忽略 特定 的 信号 , 像 SIGINT 和 SIGQUIT。 
为 一 种 不 同 的 方法 是 一 开始 就 杜绝 这 些 信 号 的 产生 。 终 端 驱动 程序 有 一 个 称 为 
ISIG 的 标志 。 阅 读 手 册 , 以 了 解 这 个 标志 的 用 途 。 然 后 使 用 这 个 标志 重 写 
sigdemo2. c, 

当 修 改过 的 程序 接收 到 从 键盘 以 外 的 地 方 发 送 来 的 SIGINT 信和 号 时 ,程序 将 做 什 
4? 学 习 命令 ki ,并 使 用 kill 发 送 SIGINT 到 关闭 了 ISIG 的 那个 版 本 的 程序 。 


中 断 并 不 总 是 破坏 性 的 。 想 象 你 正在 做 一 个 需要 若干 天 的 项 目 。 你 可 能 收 到 老 
板 询问 工作 进展 的 电话 。 这 些 中 断 是 用 来 调用 状态 报告 的 子 程序 的 ,而 不 是 用 
来 杀 死 进程 。 编 写 一 个 执行 耗 时 任务 的 C 程序 。 例 如 ,编写 一 个 使 用 较 慢 的 方 
法 寻找 素数 的 程序 。 程 序 需要 跟踪 它 到 目前 为 止 所 找到 的 最 大 的 素数 。 实 现 一 
个 SIGINT 的 处 理 器 函数 ,这 个 函数 用 来 显示 它 所 找到 的 素数 的 个 数 以 及 素数 的 
最 大 值 。 

这 个 想法 如 何 运 用 在 系统 编程 中 ? 





6. 


11 


. 12 


第 6 章 ”为 用 户 编程 : 终端 控制 和 信号 . 179 . 


在 第 1 章 中 ,实现 了 几 个 版 本 的 more。 那 时 并 不 知道 如 何 控制 终端 驱动 程序 。 
改进 那个 程序 ,使 它 运 行 无 回 显 、 非 规范 模式 中 ,并 能 对 中 断 和 终止 信号 做 出 正 
确 的 啊 应 。 


用 户 不 仅 能 够 通过 按键 产生 信号 ,也 能 通过 改变 终端 窗口 的 大 小 产生 信号 。 窗 
口 每 次 改变 大 小 时 , SIGWINCH 就 被 发 送 到 进程 。 按 默认 处 理 , 进 程 将 忽略 
SIGWINCH 信号。 编写 一 个 程序 ,使 得 能 够 在 屏幕 上 打印 满 屏 的 字母 “A”。 例 
如 ,如 果 窗 口 有 1047 20 列 , 程 序 要 显示 字母 “A”200 次 。 当 窗口 大 小 改变 时 , 程 
序 用 字母 “B” 填 充 整个 屏幕 。 下 一 次 ,使 用 “C”, 以 此 类 推 。 当 用 户 按 下 字母 “Q” 
时 ,屏幕 清除 ,程序 退出 。 当 用 户 按 下 其 他 任何 键 时 ,屏幕 从 字母 “A” 重 新 开始 。 
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概念 与 技巧 

。 有 异步 事件 驱动 编程 

。 curses 库 : 目标 和 使 用 
。 Alla] ait at ae 

。 可 靠 的 信号 处 理 

。 可 重信 代码 .临界 区 

。 异步 输入 

相关 的 系统 调用 和 函数 

e alarm, setitimer, getitimer 
* kill, pause 

e sigaction,sigprocmask 


e fcntl aio read 


7.1 视频 游戏 和 操作 系统 


贝尔 实验 室 的 Dennise Ritchie 和 Ken Thompson 为 了 玩 一 个 叫做 《星际 旅行 》 的 视频 游 
戏 , 于 是 编写 了 Unix, Ritchie Bik: 

Thompson 在 1969 年 就 开发 了 《星际 旅行 ) 这 个 游戏 。 第 一 次 是 在 Multics 操作 系统 上 ,然后 用 Fortran 
移植 到 GECOSCGE 上 运行 的 一 个 操作 系统 ,后 来 在 Honeywell 635 上 运行 ) 。 那 是 一 个 由 玩家 在 模拟 的 移 
动 太阳 系 中 ,根据 屏幕 上 显现 的 环境 引导 飞船 在 不 同 的 行星 或 卫星 上 降落 的 游戏 。GECOS 上 的 这 个 版 本 
在 两 个 重要 方面 并 不 令 人 满意 : 第 一 ,游戏 的 显示 有 些 不 连贯 ,同时 通过 涡 击 命令 来 控制 很 难 掌 握 ;第 二 , 游 
戏 需要 在 一 台大 型 机 上 大 约 花 费 75 美元 的 CPU 时 间 来 运行 。 所 以 不 入 以 后 ,Thompson 找到 一 台 很 少 使 
用 的 PDP-7 计算 机 ,这 人 台 机 器 有 很 棒 的 显示 处 理 器 , 整个 系统 被 当做 Graphic-II 的 终端 。 他 和 我 重 写 了 《 旦 
际 旅 行 } 使 之 能 运行 在 这 人 台 机 器 上 。 实 际 上 ,真正 的 目标 比 看 上 去 更 加 雄心 勃勃 因为 我 们 抛弃 了 所 有 现 
存 的 软件 ,所 以 不 得 不 写 一 个 浮 点 运算 包 , 显 示 特 性 的 点 序 规格 说 明 , 以 及 一 个 在 屏幕 角 上 连续 显示 输入 内 
容 的 排 错 子 系统 。 所 有 这 些 都 是 用 汇编 语言 写 的 ,用 一 个 在 GECOS 上 的 交叉 汇编 器 编译 到 PDP-7 的 纸 
带 上 。 
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《星际 旅行 } 尽 管 是 一 个 非常 吸引 人 的 游戏 ,但 也 只 是 主要 作为 学 习 复 杂 的 PDP-7 EFR RARER 
不 久 以 后 Thompson 开始 实现 一 个 之 前 就 已 设计 好 的 纸 带 文件 系统 (paper file system) (或 者 说 粉笔 文件 系 
统 即 chalk file system 更 加 合适 ) 。 在 没有 练习 的 情况 下 试图 建立 一 个 文件 系统 是 非常 困难 的 ,所 以 他 继续 

一 个 实用 操作 系统 的 其 他 功能 来 充实 自己 的 系统 ,尤其 是 进程 的 概念 。 然 后 是 一 小 部 分 用 户 级 的 工具 : 

复制 .打印 .删除 和 编辑 文件 的 工具 。 当 然 还 有 一 个 简单 的 命令 解释 器 (shell)。 直 到 此 时 所 有 的 程序 还 是 
在 GECOS 上 写 的 ,然后 用 纸 带 转移 到 PDP-7 上 ,但 是 一 旦 有 一 个 自己 的 汇编 器 它 就 可 以 支持 自己 了 。 尽 管 
直到 1970 年 Brian Kernighan 才 建 议 使 用 Unix( 某 种 程度 上 有 点 像 Multics 的 双关 语 ) 来 命名 系统 ,如 今 所 
知 这 个 操作 系统 已 经 诞生 了 。 | 

视频 游戏 和 操作 系统 有 很 多 共同 点 。 在 本 章 中 将 完成 一 个 简单 的 视频 游戏 。 通 过 这 个 
例子 来 介绍 更 多 的 Unix 系统 服务 .一 些 基 本 原则 和 操作 系统 设计 技术 。 

l. 视频 游戏 做 什么 

考虑 一 a REM p poni 程序 创立 行星 、 流 星 、 飞 船 和 其 他 物体 的 
影像 ,并 使 它们 移动 。 每 一 个 物体 有 自己 的 移动 速度 、 方 向 、 劲 力 和 其 他 一 些 属性 。 物体 之 
间 相 互 作用 。 一 个 流星 可 能 擅 上 飞船 或 其 他 流 旺 ， 

游戏 同时 要 响应 用 户 输 入 。 游 戏 玩家 们 通过 按钮 .鼠标 和 轨迹 球 在 任何 时 刻 都 有 可 能 
生成 输入 ,程序 必须 在 很 短 的 时 间 里 作出 响应 。 这 些 输入 事件 会 影响 游戏 中 物体 的 属性 。 
通过 按 下 按钮 ,用 户 可 以 增加 飞船 速度 或 是 减少 飞船 质量 。 飞 船 的 变化 会 影响 它 与 其 他 物 
体 的 作用 方式 。 

2. 视频 游戏 如 何 做 

一 个 视频 游戏 综合 了 一 些 基 本 的 概念 和 原则 。 

(1) 空间 

游戏 必须 在 计算 机 屏幕 的 特定 位 置 画 影像 。 程 序 如 何 控 制 视频 显示 ? 

(2) 时 间 

影像 以 不 同 的 速度 在 屏幕 上 移动 。 以 一 个 特定 的 时 间 间 隔 改 变 位 置 。 程 序 是 如 何 获知 
时 间 并 且 在 特定 的 时 间 安 排 事 情 的 发 生 ? | 

(3) rp er 

程序 在 屏幕 上 平滑 的 移动 物体 ,用 户 可 在 任意 时 刻 产 生 输 入 。 程 序 是 如 何 响应 中 断 的 ? 

(4) 同时 做 几 件 事 

泊 戏 必须 在 保持 几 个 物体 移动 的 同时 还 要 响应 中 断 。 程 序 是 如 何 同时 做 多 件 事情 而 不 
BFE AS SEK E YY? 

3. 操作 系统 面临 类 似 的 问题 

操作 系统 同样 要 面 对 这 4 个 问题 。 内 核 将 程序 载 人 内 存 空间 并 维护 每 个 程序 在 内 存 中 
所 处 的 位 置 。 在 内 核 的 调度 下 ,程序 以 时 间 片 间隔 的 方式 运行 ,同时 ,内 核 也 在 特定 的 时 刻 
运行 特定 的 内 部 任务 。 内 核 必 须 在 很 短 的 时 间 内 响应 用 户 和 外 设 在 任何 时 刻 的 输入 。 同 时 
做 几 件 事情 需要 一 些 技巧 。 内 核 是 如 何 保证 数据 的 有 序 和 规整 的 ? 

4. 屏幕 管理 ,时间 、 信 号、 共享 资源 

本 章 将 学 习 屏 幕 管理 ,时间 .信号 和 如 何 安全 地 同时 做 几 件 事情 。 为 了 学 习 这 4 个 基本 
主题 ,将 编写 一 个 基于 字符 终端 的 动画 游戏 。 

为 什么 是 基于 字符 的 图 形 界面 ? 
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为 什么 不 用 强大 的 X11 来 编程 或 者 是 Java 来 绘图 ? 这 里 有 很 多 原因 。 首 先 ,基于 字符 
的 游戏 除了 每 个 像素 大 些 外 ,其 他 与 高 分 辨 率 的 图 形 界面 游戏 非常 相似 。 其 次 是 可 移植 性 。 
字符 图 形 界面 游戏 只 需要 一 个 终端 模拟 器 和 一 个 连接 ,这 些 是 每 个 系统 都 提供 的 。 第 三 ,在 
绘图 上 省 下 来 的 时 间 可 以 用 在 系统 编程 上 。 尽 管 如 此 ,如 果 喜 欢 更 好 的 图 形 界面 ,网 站 上 有 
这 个 游戏 的 X Windows 版 本 。 


7.2 任务 : ASHER ER (Pong) 


现在 开始 了 。 本 章 的 主要 任务 是 实现 一 个 在 游戏 房 和 家 庭 中 常见 的 经 典 游戏 一 一 弹 球 
游戏 。 图 7. 1 显示 了 它 的 3 个 主要 元 素 : 墙 球 和 挡 板 。 游 戏 的 概要 描述 如 下 ， 

(1) 球 以 一 定 的 速度 移动 ; | 

(2) 球 碰 到 墙壁 或 挡 板 会 被 弹 回 ; 

(3) 用户 按 按钮 来 控制 挡 板 上 下 移动 。 


挡 板 : 用 户 控制 
RR: 屏幕 上 弹 来 弹 去 


目标 : 不 让 球 飞 出 去 





图 7.1 单 人 视频 游戏 


号 这 个 游戏 需要 了 解 如 何 管理 屏幕 .时 间 和 中 断 , 还 要 理解 如 何 安全 地 同时 做 几 件 事 
情 。 下 面 一 样 一 样 来 学 。 


7.3 Bx: curses 库 


curses 库 是 一 组 函数 ,程序 员 可 以 用 它们 来 设置 光标 的 位 置 和 终端 屏幕 上 显示 的 字符 样 
X. curses 库 最 初 是 由 UCB 的 开发 小 组 开发 的 。 大 部 分 控制 终端 屏幕 的 程序 使 用 curses, 
曾经 由 一 组 简单 的 函数 组 成 的 库 现在 包括 了 许多 复杂 的 特性 。 这 里 将 使 用 其 中 很 少 -部 分 
的 功能 ，。 


7.3.1 介绍 curses 


curses 将 终端 屏幕 看 成 是 由 字符 单元 组 成 的 网 格 ,每 一 个 单元 由 ( 行 、 列 ) 坐标 对 标示 。 
坐标 系 的 原点 是 屏幕 的 左上 角 , 行 坐标 自 上 而 下 递增 , 列 坐 标 自 左 向 右 递增 。 图 7. 2 显示 了 
curses BE RE, 

curses 具有 的 函数 包括 可 以 将 光标 移动 到 屏幕 上 任何 行 、 列 单元 ,添加 字符 到 屏幕 或 者 
从 屏幕 上 删除 字符 ,设置 字符 的 可 视 属性 (如 颜色 、 亮 度 ) ,建立 和 控制 窗口 以 及 其 他 文本 区 
域 。 用 户 手册 有 curses 的 所 有 函数 的 详细 描述 。 这 里 将 用 到 其 中 的 9 个。 
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initser() 
endwin() 
refresh() 
move(r,c) 
addstr(s) 
addch(c) 
clear() 
standout() 
standend() 


curses 例 1. hellol.c 

















图 7.2 curese 视屏 幕 为 网 格 


基本 curses 函数 
初始 化 curses 库 和 tty 
XH] curses JF E B tty 
使 屏幕 按照 你 的 意图 显示 
移动 光标 到 屏幕 的 (r,c) 位 置 
在 当前 位 置 画 字符 串 s 
在 当前 位 置 画 字符 c 


清 屏 


启动 standout 模式 (一 般 使 屏幕 反 色 ) 


关闭 standout 模式 


第 一 段 程序 展示 了 一 个 curses 程序 的 基本 逻辑 ; 


/x hellol.c 
* purpose show the minimal calls needed to use curses 
* outline initialize, draw stuff, wait for input, quit 
x/ 


# include  «stdio.h— 
 # include <curses. h> 


main() 


{ 


initscr() ; 


clear(); 
move(10,20); 


addstr("Hello, world"); 


move(LINES ~ 1,0); 
refresh(); 


getch( ; 


/* 
/* 
/* 
/* 
/* 


/* 
/* 


turn on cursesx/ 
send requests x/ 
Clear screen x/ 
row10,col20 x/ 

add a string x/ 

move to LL x/ 

update the screen x/ 


wait for user input x/ 
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endwin(); /* turn off curses x/ 


编译 和 运行 程序 非常 简单 : 


$ cchellol.c ~ l curses - o hellol 


$ ./hellol 


输出 如 图 7. 3 所 示 。 这 个 程序 在 连接 到 任何 Unix 系统 的 任何 终端 上 都 能 运行 。 


Hello, World 





图 7.3 第 一 个 基于 curses 的 程序 


curses 例 2: hello2. c 
将 curses 函数 与 循环 .变量 和 其 他 函数 组 合 在 一 起 会 产生 更 复杂 的 显示 效果 。 预 测 以 


下 第 2 个 例子 的 输出 : 


/x hello2.c 
* purpose show how to use curses functions with a loop 


x outline initialize, draw stuff, wrap up 


x/ 


# include <stdio.h> 
# include <(curses. h> 


maint ) 


{ 


int i; 


initscrO; /* turn on curses x/ 
clear(); /* draw some stuff x/ 
for (i=0; i-LINES; i++ ){ /* ina loop x/ 
move( i, iti); | 
if (1%2 == 1) 
standout(); 
addstr("Hello, world"); 
if(i&2 == 1) 
standend() ; 
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refresh(); /* update the udiven */ 
getch(); /x wait for user input*/ 
endwin() ; /x reset the tty etc x/ 


) 
编译 并 运行 它 。 你 的 预测 正确 吗 ? 
7.3.2 curses 内 部 : 虚拟 和 实际 屏幕 


refresh 函数 做 了 些 什 么 ? 试验 一 下 : 注释 掉 该 行 ,重新 编译 ,运行 程序 。 结 果 是 什么 都 
没有 出 现在 屏幕 上 。 

curses 设计 成 为 能 够 在 不 阻塞 通信 线路 的 情况 下 更 新 文本 屏幕 。curses 通过 虚拟 屏幕 
(如 图 7.4 所 示 ) 来 最 小 化 数据 流量 。 


addstr 写 人 屏幕 缓存 屏幕 缓存 





refresh 更 新 真实 屏幕 
7.4. Curses 保持 真实 屏幕 的 副本 


真实 屏幕 是 眼前 的 一 个 字符 数组 。curses 保留 了 屏幕 的 两 个 内 部 版 本 。 一 个 内 部 屏幕 
是 真实 屏幕 的 复制 。 另 一 个 是 工作 屏幕 ,其 上 记录 了 对 屏幕 的 改动 。 每 个 函数 ,比如 move, 
addstr 等 都 只 在 工作 屏幕 上 进行 修改 。 工 作 屏 幕 就 像 磁 盘 缓 存 ,curses 中 的 大 部 分 的 函数 都 
只 对 它 进行 修改 。 | 

refresh 函数 比较 工作 屏幕 和 真实 屏幕 的 差异 。 然 后 refresh 通过 终端 驱动 送出 那些 能 
使 真实 屏幕 与 工作 屏幕 一 致 的 字符 和 控制 码 。 例 如 ,如 果真 实 屏 幕 的 左上 角 是 Smith, 
James, 然 后 用 addstr 把 Smith Jane 放 在 相同 的 位 置 , 调 用 refresh hif REA n 和 空格 蔡 换 
了 James 中 的 m 和 s。 这 种 只 传输 改变 的 内 容 而 不 是 影像 本 身 的 技术 被 用 在 视频 流 中 。 


7.4 时 钟 编 程 : sleep 


为 了 写 一 个 视频 游戏 ,需要 把 影像 在 特定 的 时 间 置 于 特定 的 位 置 。 用 curses 把 影像 置 
于 特定 的 位 置 。 然 后 在 程序 中 添加 时 间 响 应 。 第 1 步 使 用 系统 图 数 sleep, 
动画 例子 1: hello3. c 


/* hello3.c 


* purpose using refresh and sleep for animated effects 
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* outline initialize, draw stuff, wrap up 
x/ 
i include  «—stdio. h> 


#4 include «curses. h> 


main) 


{ 


int i; 


initscr() ; 
clear(); 


for(i-0: 


;Íi« LINES; itt ){ 
move( i, iti); 
if (i%2 == 1) 
standout() ; 
addstr( "Hello, world"); 
if €i%2 == 1) 
standend() ; 
sleep(1); 
refresh(); 
j 


endwin(); 


} 


当 编 译 并 运行 这 个 程序 的 时 候 , 将 看 到 bello 字符 串 在 屏幕 自 上 而 下 逐 行 显示 ,每 秒 增 
加 一 行 , 反 色 和 正常 显示 交替 出 现 。 为 什么 在 每 次 循环 结束 都 要 调用 refresh? 如 果 不 这 样 
会 有 什么 效果 ? 

动画 例子 2: hello4. c 


/* hello4.c 
* purpose show how to use erase, time, and draw for animation 
*/ 
# include <stdio.h> 
# include «curses. h> 


main() 
( 


int i ; 


initscr(); 
clear(); 
for(i=0; 


; i<cLINES; i++ ){ 
move( i, iti); 
if ( i%2 == 1) 
standout() ; 
addstr( "Hello, world"); 


if ( i%2 == 1) 
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standend(); 


refresh(); 


sleep(1); 
move(i,i-*i); /* move back «/ 
addstr(" ") 3 /* erase line x/ 
j 
endwin() ; 


} 


hello4 创造 移动 的 假象 。 字 符 串 沿 着 对 角 线 缓慢 向 下 移动 。 秘 诀 是 先 在 一 个 地 方 夯 字 
ITE ,睡眠 1 秒 钟 , 然 后 在 原来 的 地 方 画 空 字符 串 以 删除 原 有 影像 ,最 后 将 输出 位 置 推进 。 注 
意 在 两 次 请 求 之 后 通过 调用 refresh 来 保证 每 次 循环 后 旧 的 影像 消失 ,新 的 影像 显示 。 图 
7.5 是 屏幕 的 一 个 快照 。 


— 
Hello, world 





图 7.5 字符 串 慢 慢 向 下 移动 


下 一 个 例子 将 字符 串 在 屏幕 四 壁 弹 来 弹 去 。 
动画 例子 3: hello5. c 


/x hello5.c 

* purpose bounce a message back and forth across the screen 
* compile cc hello5.c - icurses - o hello5 

*/ 

# include <curses. h> 


# define LEFTEDGE 10 
# define  RIGHTEDGE 30 


# define ROW 10 
main() 

人 

char message = "Hello"; 
char blank = " "s 
int dir = +1; 


int pos = LEFTEDGE ; 


initscr(); 


Clear() ， 
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while(1){ 
move( ROW, pos) ; 
addstr( message ); /x draw string */ 
move(LINES — 1,COLS - 1); /* park the cursor «/ 
refresh(); /* show string */ 
sleep(1); 
move(ROW, pos) ; /* erase string x/ 
addstr( blank ); 
. pos += dir; /* advance position x/ 
if ( pos >= RIGHTEDGE ) /* check for bounce x/ 
dir = -1; 
if ( pos <= LEFTEDGE ) 
dir = +1; 


} 

变量 dir 用 来 控制 字符 串 移 动 的 速度 。 当 dir 是 十 1 时 ,字符 串 每 一 秒 向 右 移动 一 列 。 
当 dir 是 一 1 时 ,字符 串 每 秒 向 左 移动 一 列 。 改 变 dir 的 符号 就 改变 了 字符 串 移 动 的 方向 。 
图 7.6 是 某 一 特定 时 刻 屏 幕 的 快照 。 





现在 该 如 何 做 ? 

现在 离 能 够 写 出 一 个 像样 的 动作 类 视频 游戏 有 多 远 ? 已 经 知道 了 如 何在 屏幕 的 任何 地 
方 画 字符 串 ,也 知道 了 如 何 通过 画 、 控 掉 和 重 画 之 间 搬 人 时 延 米 创造 动画 效果 。 迄 今 实 现 的 
程序 还 不 错 , 只 是 : 

C1) 一 秒 钟 的 时 延 太 长 ,需要 更 精确 的 计时 器 ; 

(2) 需要 增加 用 户 输入 。 

这 些 问 题 引 出 新 的 话题 : 用 时 钟 和 高 级 信和 号 编程 。 然 后 ,将 再 次 回 到 这 个 游戏 。 


7.5 ”时钟 编程 1: Alarms 


程序 可 以 以 不 同 的 方式 使 用 时 钟 。 可 以 用 来 在 执行 流 中 加 入 时 延 。 前 面 的 3 个 例子 里 
用 sleep 加 入 时 延 。 时 钟 的 另 一 个 用 途 是 调度 一 个 将 来 要 做 的 任务 ,就 像 所 好 一 个 煮 鸡 蛋 的 
定时 项 ,然后 干 别 的 事情 直到 定时 器 鸣叫 。 同 样 的 目的 ,Unix 提供 alarm, 


第 7 章 事件 驱动 编程 : 编写 一 个 视频 游戏 * 189 * 


7.5.1 添加 时 延 : sleep 
为 了 在 程序 中 添加 时 延 ,使 用 sleep PRA: 


sleep(n) 


sleep(n) 将 当前 进程 挂 起 ” 秒 或 者 在 此 期 间 被 一 个 不 能 忽略 的 信号 的 到 达 所 唤醒 


7.5.2 sleep() 是 如 何 工 作 的 : 使 用 Unix 中 的 Alarms 


sleep 盟 数 的 工作 机 理 与 你 想 睡 定 长 时 间 的 觉 一 样 
(1) 设置 闹钟 到 你 想 睡 的 秒 数 ; 


(2) 睡觉 ,直到 闹钟 的 铃声 响起 。 
图 7. 7 是 这 个 机 制 的 示意 图 。 系 统 中 的 每 个 进程 都 有 一 个 私有 的 闹钟 (alarm clock). 


这 个 闹钟 很 像 一 个 计时 器 ,可 以 设置 在 一 定 秒 数 后 闹 铃 。 时 间 一 到 ,时 钟 就 发 送 一 个 信和 号 
SIGALRM 到 进程 。 除 非 进程 为 SIGALRM 设置 了 处 理 函 数 (handler) ,否则 信和 号 将 杀 死 这 


个 进程 。sleep RAH 3 个 步骤 组 成 
1. 为 SIGALRM 设置 一 个 处 理 函 数 ; 


2. 调用 alarm(num. seconds) ; 


3. 调用 pause, 
sleep pi A 2 tn fay T f E BS. 
Signal(SIGALRM, handler); 


alarm(n); 
pause( ) ; 





每 个 进程 有 自己 的 计时 器 


图 7.7 一 个 进程 设置 一 个 闹钟 后 挂 起 
系统 调用 pause 挂 起 进程 直到 信和 号 到 达 。 任何 信号 都 可 以 唤醒 进程 ,而 非 仅仅 等 待 
SIGALRM。 以 上 想法 总 结 为 以 下 代码 . 


/* sleepl.c 
* purpose show how sleep works 
* usage sleepl 


* outline sets handler, sets alarm, pauses, then returns 


*/ 

# include <stdio.h> 
# include <signal.h> 
// # define SHHHH 


main() 


{ 
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void wakeup(int); 


printf("about to sleep for 4 seconds\n") ; 


signal(SIGALRM, wakeup) ; : /* catch it x/ 
alarm(4); /* set clock x/ 
pause() ; /x freeze here x/ 


printf( "Morning so soon? Mn"); /* back to work x/ 


j 


void wakeup(int signum) 

{ 

# ifndef SHHHH 

printf( "Alarm received from kernel\n") ; 

+ endif 

} 

这 里 调用 signal 设置 SIGALRM 处 理沙 数 , 然 后 调用 alarm 设置 一 个 4 秒 的 计时 器 ,最 
后 调用 pause 等 待 。 

调用 pause 的 目的 是 挂 起 进程 直到 有 一 个 信号 被 处 理 。 当 计时 器 计时 4 秒 钟 以 后 ,内 核 
送出 SIGALRM 给 进程 ,导致 控制 从 pause 跳 转 到 信号 处 理 函 数 。 在 信和 号 处 理 程序 中 的 代码 
被 执行 ,然后 控制 返回 。 当 信和 号 被 处 理 完 后 ,pause 返回 ,进程 继续 。 图 7. 8 总 结 了 pause 的 
执行 过 程 。 






正音 的 控制 流 


pause ( ) 系 统 调用 导致 进 
程 阻塞 直到 信和 号 被 处 理 


图 7.8 进入 处 理 函 数 的 执行 流 





下 面 是 alarm 和 pause 的 细节 : 
alarm 
目标 设置 发 送信 号 的 计时 器 
头 文 件 # include —unistd. h> 
函数 原型 unsigned old — alarm(unsigned seconds) 
参数 seconds 等 待 的 时 间 CEP) 
T =j 如 果 出 错 


old 计时 器 剩余 时 间 
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alarm 设置 本 进程 的 计时 器 到 seconds 秒 后 激发 信号 。 当 设 定 的 时 间 过 去 之 后 ,内 核发 
送 SIGALRM 到 这 个 进程 。 如 果 计 时 器 已 经 被 设置 ,alarm 返回 剩余 秒 数 (注意 : 调用 alarm 
(0) 意味 着 关 掉 羡 钟 ) 。 








pause 
目标 等 待 信号 
头 文件 # include <unistd. h> 
函数 原型 result — pause() 
参数 没有 参数 
返回 值 总 是 一 1 





pause 挂 起 调用 进程 直到 一 个 信号 到 达 。 如 果 调 用 进程 被 这 个 信号 终止 ,pause 没有 返 
回 。 如 果 调 用 进程 用 一 个 处 理 函 数 捕获 ,在 控制 从 处 理 函 数 处 返回 后 pause 返回 。 这 种 情况 
F errno 被 设置 为 EINTR, 


7.5.3 调度 将 要 发 生 的 动作 


计时 器 的 另 一 个 用 途 是 调度 一 个 在 将 来 的 某 个 时 刻 发 生 的 动作 同时 做 些 其 他 事情 。 调 
度 一 个 将 要 发 生 的 动作 很 简单 ,通过 调用 alarm 来 设置 计时 器 ,然后 继续 做 别 的 事情 。 当 计 
时 估计 时 到 0, 信 号 发 送 ,处 理 函 数 被 调用 。 


7.6 时 钟 编程 2: 间隔 计时 器 


Unix 很 早 就 有 sleep 和 alarm。 它们 所 提供 的 时 钟 精度 为 秒 , 对 于 很 多 应 用 来 说 这 个 精 
度 是 不 能 让 人 满意 的 。 后 来 一 企 更 强大 和 使 用 广泛 的 计时 器 系统 被 添加 进来 。 这 个 新 的 系 
统 使 用 一 个 被 称 做 为 间隔 计时 器 (interval timer) 的 概念 ,有 更 高 的 精度 。 而 且 每 个 进程 都 有 
3 个 独立 的 计时 器 而 不 是 原来 的 一 个 。 这 还 不 是 全 部 。 每 个 计时 器 都 有 两 个 设置 , 初始 间 
隔 和 重复 间隔 设置 。 新 的 系统 还 支持 alarm 和 sleep, 它们 对 大 多 数 应 用 来 说 已 经 足够 了 。 
图 7.9 是 它 的 一 个 相应 的 示意 图 。 


每 个 进程 有 三 人 计时 器 


每 个 计时 器 有 两 个 设置 ; 
到 第 一 个 信号 的 时 间 和 两 次 
信和 号 间 的 时 间 间 隔 





真实 虚拟 实用 
图 7.9 每 个 进程 有 3 个 计时 器 


.可 以 用 这 个 新 的 系统 来 添加 时 延 和 为 事件 定时 。 
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7.6.1 添加 精度 更 高 的 时 延 : usleep 

为 了 添加 精度 更 高 的 时 延 ,使 用 usleep: 

usleep(n) | 

usleep(n) 将 当前 进程 挂 起 x 微 秒 或 者 直到 有 一 个 不 能 被 忽略 的 信号 到 达 。 
7.6.2 三 种 计时 器 : 真实 .进程 和 实用 


进程 可 以 以 3 种 方式 来 计时 。 考 虑 一 个 程序 在 运行 了 30 s 后 结束 。 在 二 外 分 时 系统 
中 ,这 个 程序 不 是 一 直 在 运行 的 ,其 他 的 程序 与 它 共享 处 理 器 。 图 7.10 显示 了 一 种 可 能 性 。 


时 间 : 真实 30s 虚拟 10 s (用 户 态 ) 实用 15s (用 户 十 核心 态 ) 





图 7. 10 .时 间 用 在 哪里 


图 7. 10 显示 从 0 到 5 s 进程 在 用 户 模式 运行 , 接着 从 5 到 15 s 睡眠 ,然后 在 核心 态 运行 
到 20s 睡 眠 ,如 此 这 般 。 显 然 从 开始 到 结束 ,程序 使 用 了 10s 的 用 户 时 间 .5 s 的 系统 时 间 。 
并 显示 了 3 种 时 间 : 真实 时 间 、 用 户 时 间 和 用 户 时 间 十 篆 统 时 间 - 内 核 提供 计时 器 来 计量 这 
3 种 类 型 的 时 间 。3 类 计时 器 的 名 字 和 功能 如 下 

(1) ITIMER REAL 

这 个 计时 器 计量 真实 时 间 , 如 同 手表 记录 时 间 . HRERKGR SEMPRE RRA 
态 用 了 多 少 处 理 器 时 间 它 都 记录 。 当 这 个 计时 器 用 尽 , 发 送 SIGALRM 消息 . 

(2) ITIMER VIRTUAL 

这 个 计时 器 就 像 美式 橄榄 球 中 用 的 计时 方法 ,只 有 进程 在 用 户 态 运行 时 才 计 时 。 虚 拟 
计时 器 (virtual timer) 的 30 s 比 实际 计时 器 (real timer) 的 30s 要 长 。 当 虚拟 计时 器 用 尽 , 发 
送 SIGVTALRM 消息 。” 

(3) ITIMER PROF 

这 个 计时 器 在 进程 运行 于 用 户 态 或 由 该 该 进程 调用 而 陷 大 核心 态 时 计时 。 当 这 个 计时 器 
用 尽 ,发送 SIGPROF 消息 。 


7.6.3 两 种 间隔 : 初始 和 重复 
医生 给 你 一 些 药丸 并 告诉 你 :“ 过 一 个 小 时 吃 第 一 粒 , 然 后 Ja SEES 4 个 小 时 吃 一 粒 ,” 你 需 
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要 设置 计时 器 到 1 个 小 时 ,然后 在 每 次 时 尽 后 再 设置 为 4 个 小 时 。 每 个 间隔 计时 器 的 设置 都 
有 这 样 两 个 参数 : 初始 时 间 和 重复 间隔 。 在 间隔 计时 器 用 的 结构 体 中 初始 时 间 是 it_value， 
重复 间隔 是 it_interval。 如 果 不 想 要 重复 这 一 特征 ,将 it_interval 设置 为 0。 要 把 两 个 时 钟 
都 关 掉 , 设 it value 为 0。 


7.6.4 用 间隔 计时 器 编程 


程序 中 使 用 alarm 不 难 , 只 要 传 给 alarm 秒 数 就 可 以 了 。 程 序 中 使 用 间隔 计时 器 要 
复杂 一 点 ,要 选择 计时 器 的 类 型 ,然后 需要 选择 初始 间隔 和 重复 间隔 ,还 要 设置 在 struct 
itimerval 中 的 值 。 比 如 ,为 了 使 用 间隔 计时 器 来 提醒 你 按 7. 6. 3 节 规 定 的 计划 吃 药 , 设 
A it value 为 1 小 时 ,设置 it_interval 为 4 小 时 ,然后 将 这 个 结构 体 通 过 调用 setitimer f£ 
给 计时 器 。 为 了 读 取 计 时 器 设置 ,使 用 getitimer。 图 7.11 是 系统 响应 的 示意 图 。 


struct itimerval 


getitimer ( ) 





图 7.11 读 写 计时 器 设置 


1. 间隔 计时 器 例子 : ticker demo.c 
程序 ticker demo. c 演示 了 如 何 使 用 一 个 间隔 计时 器 : 


/* ticker demo.c 
x demonstrates use of interval timer to generate reqular 
x signals, which are in turn caught and used to count down 
x / 


# include <stdio.h> 
# include < sys/time.h 
# include <signal. h> 


int main() 


{ 


void countdown( int); 


signal(SIGALRM, countdown); 
if ( set ticker(500) == -1) 
perror("set ticker"); 
else 
while( 1 ) 
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pause(); 


return 0; 


void countdown(int signum) 
1 
static int num - 10; 
printf("&d ..", num-- ); 
fflush(stdout); 
if ( num < 0 ){ 
printf("DONE! \n"); 
exit(0); 


/* (from set ticker.c] 

* set ticker( number of milliseconds ) 

x arranges for interval timer to issue SIGALRMs at regular intervals . 
x returns — 1 on error, 0 for ok 

* arg in milliseconds, converted into whole seconds and microseconds 
* note; set ticker(0) turns off ticker 


x*/ 


int set ticker( int n msecs ) 
{ 
struct itimerval new timeset; 


long n sec, n usecs; 


n sec = n msecs / 1000 ; /* int part x/ 
n usecs = ( n msecs % 1000) x 1000L ; /* remainder x/ 
new timeset.it interval.tv sec = n sec; /*set reload */ 


new timeset.it interval.tv usec- n usecs; /xnew ticker 


F 


valuex/ 
new timeset.it value.tv sec = n sec; /*store thisx/ 
new timeset.it value.tv usec = n usecs; /xand thisx/ 


return setitimer(ITIMER REAL, &new timeset, NULL); 


来 看 看 ticker demo. c 的 程序 流程 。 一 开始 使 用 signal 设置 函数 countdown 来 处 理 
SIGALRM 信和 号。 然后 通过 set ticker 来 设置 微 秒 数 。 

set ticker 通过 装载 初始 间隔 和 重复 间隔 设置 间隔 计时 器 。 每 个 间隔 是 由 两 个 值 组 成 ， 
秒 数 和 微 秒 数 , 这 就 像 实数 的 整数 部 分 和 小 数 部 分 。 计 时 器 开始 计时 ,控制 返回 到 main, 
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回 到 main, ticker_demo. c 进入 一 个 无 尽 的 循环 ,其 间 调 用 pause。 每 过 大 约 500 4S， 控 
制 跳 转 到 countdown PA. countdown 将 一 个 静态 变量 的 值 递减 ,打印 一 条 消息 ,通常 情况 
下 返回 调用 者 。 当 变量 num 达到 0 HY, countdown 调用 exit. 
当然 ,main 不 是 一 定 要 调用 pause 的 。 主 程序 可 以 做 些 其 他 更 有 趣 的 事情 ,这 样 在 每 个 


预定 的 时 刻 还 是 会 跳 转 到 countdown 的 。 
间隔 计时 器 的 设置 是 通过 struct itimerval 来 完成 的 。 这 个 结构 类 型 包括 初始 间隔 和 重 


复 间隔 ,两 者 存储 在 struct timeval 中 : 


struct itimerval 


{ 


struct timeval it value; /* time to next timer expirationx/ 
struct timeval it interval; /x reload it value with this x/ 


j 


struct timeval | 
time t tv sec /* seconds*/ 


suseconds t tv usec; /* and microseconds* / 


} 


不 同 的 Unix 版 本 ,struct timeval 的 细节 可 能 有 些 差异 。 查 一 下 你 的 系统 的 相应 手册 和 


头 文件 。 
图 7.12 显示 了 结构 中 各 成 员 的 关系 ,图 7.13 显示 了 如 何 载 人 数据 以 使 第 一 次 计时 器 到 


达 时 间 为 60. 5 s, 然 后 每 240. 25 s 重复 一 次 。 


















ITIMER REAL ITIMER VIRTUAL ITIMER PROF 
itvaue [ 1 ^] || itvaue C 1 ' E TI! 
it_interval [ [. ]|| itineval[ |, jw meval, |. 

struct itimerval struct timeval 
每 个 计时 器 有 两 个 设置 : 剩 下 的 时 间 和 struct timeval 有 两 个 成 员 
重复 时 间 . 这 两 个 设置 由 struct timeval 变量 : 秒 数 和 微 秒 数 
中 的 两 个 成 员 变 量 表 示 


图 7.12 间隔 计时 器 内 部 
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—TIMER REAL — 0o 这 个 例子 中 将 记录 真实 时 间 


| it vale [ 60 [500000] | 的 间隔 计时 器 设置 为 60.55 


. 后 传递 第 一 人 信号 ， 然 后 每 
tinterval | 240 | 250000 | | 隔 240.25s 传递 一 次 信号 。 


| tv sec tv usec | 


图 7.13 秒 和 微 秒 








2. 系统 调用 小 结 





getitimer , setitimer 


目标 取得 或 设置 间隔 计时 器 
头 文件 # include « sys/time. h> 
FE lI E] result — getitimer(int which, 


struct itimerval * val); 
result 一 sctitimer(int which, 
const struct itimerval * newval, 


struct itimerval * oldval) ; 


参数 which 获取 或 设置 的 计时 器 
val 向 当前 设置 值 的 指针 


newval 指向 要 被 设置 值 的 指针 
oldval 指向 被 替换 的 设置 值 的 指针 





返回 值 —1 出 错 
0 成 功 
一 >- FF LLLA 
getitimer 将 某 个 特定 计时 器 的 当前 设置 读 到 val 指向 的 结构 中 。setitimer 将 计时 器 设 
BJ newval 指向 的 结构 的 值 。 如 果 oldval 不 指向 null, 之 前 T NET AE IO DE RE E k E SH BY 
oldval 指 问 的 结构 中 ，。 


which 的 值 指定 将 要 被 读 或 更 新 的 计时 器 。 计 时 器 的 编码 分 别 是 ITIMER REAL, 
ITIMER VIRTUAL #f ITIMER PROF, 


7.6.5 计算 机 有 几 个 时 钟 


如 何 才 能 让 每 个 进程 有 3 个 独立 的 计时 器 ? 有 些 系统 同时 有 几 百 个 进程 在 运行 。 计算 
机 里 有 几 百 个 独立 的 时 钟 吗 ? 不 ,一 个 系统 只 需要 一 个 时 钟 来 设置 节拍 。 这 就 像 用 一 个 节 
担 器 来 为 一 个 弦 乐 四 重奏 乐团 定 拍子 ,或 者 像 有 规律 摆动 的 钟 摆 驱 动 一 个 古老 钟表 里 的 几 
根 指针 。 一 个 硬件 时 钟 的 脉冲 是 计算 机 里 惟一 需要 的 时 钟 。 如 何 只 用 一 个 时 钟 在 设置 一 个 
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进程 的 私有 计时 器 为 5 s 的 同时 又 设置 另 一 个 进程 的 秘 有 计时 器 为 12 s? 

一 个 古老 的 时 钟 是 如 何 让 时 针 、 分 针 和 秒针 激 不 同 的 速度 转动 的 ? 它们 的 答案 是 一 样 
的 。 每 个 进程 设置 自 己 的 计数 时 间 , 操 作 系 统 在 每 过 一 个 时 间 片 后 为 所 有 的 计数 器 的 数值 
做 递减 。 一 个 实际 的 例子 可 届 澄 清 这 些 概念 。 

考虑 两 个 进程 : 进程 A 和 进程 B。 进 程 A 设置 它 的 真实 计时 器 (real timer) 为 5 s, 进 程 
B 设置 它 的 真实 计时 器 为 12 s。 为 了 使 数字 看 起 来 简单 ,假设 系统 时 钟 每 秒 跳 100 F. 
程 A 设置 它 的 时 钟 时 ,内 核 设置 它 的 计数 器 为 500。 当 进 程 B 设置 它 的 时 钟 时 ,内 核 设置 它 
的 计数 器 为 1200, 如 图 7. 14 fra. | 





每 个 进程 的 间隔 计时 器 一 个 真实 的 时 钟 


每 个 进程 通过 调用 alarm 来 设置 它 的 私有 计时 器 。 内 核 在 每 次 
收 到 时 钟 中 断 的 时 候 更 新 所 有 的 进程 计时 器 


7.14 两 个 计时 器 一 个 时 钟 


每 当 内 核 收 到 系统 时 钟 脉冲 , 它 遍 历 所 有 的 间隔 计时 器 ,使 每 个 计数 器 减 一 个 时 钟 音 
位 。 当 进程 A 的 计数 器 达到 0 的 时 候 ,意味 着 已 经 有 500 时 钟 节拍 过 去 了 ,内 核发 送 
SIGALRM 给 进程 A。 如 果 进 程 A 已 经 设置 了 计时 器 的 it_interval 值 ,内 核 将 这 个 信 复 制 到 
it value 计数 器 ,否则 内 核 就 关 掉 这 个 计时 器 。 | 

髓 过 一 会 ,内 核 将 进程 B 的 计数 器 也 减 到 0, 相应 地 向 进程 B 发 出 信号 。 如 果 卫 设置 了 
计时 器 的 重 载 值 (reload value), 内核 就 设置 it. value 为 相应 的 值 , 然 后 继续 处 理 下 一 个 计 
时 器 。 

通过 这 个 简单 的 机 制 , 每 个 进程 就 可 以 设置 自己 的 计时 器 。 这 个 计时 器 在 进程 睡眠 的 
时 候 也 在 倒计时 。 

其 他 的 两 个 计时 器 如 何 工作 ? 它们 不 是 固定 的 倒计时 ,而 仅仅 在 进程 处 于 某 个 特定 状 
态 时 倒计时 。Linux 源 代码 清楚 地 给 出 了 它们 是 如 何 实现 的 。 


7.6.6 计时 器 小 结 


一 个 Unix 程序 用 计时 器 来 挂 起 执行 和 调度 将 要 采取 的 动作 。 一 个 计时 器 是 内 核 的 一 
种 机 制 。 通 过 这 种 机 制 ,内 核 在 一 定 的 时 间 之 后 向 进程 发 送 SIGALRM。alarm 系统 调用 在 
特定 的 实际 秒 数 之 后 发 送 SIGALRM 给 进程 。setitimer 系统 调用 以 更 高 的 精度 控制 计时 
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器 ,同时 能 够 以 固定 的 时 间 间 隔 发 送信 号 。 
现在 已 经 知道 如 何在 程序 中 计时 了 。 要 实现 视频 游戏 还 需要 一 项 技术 : 管理 中 断 。 


7.7 信号 处 理 1: 使 用 signal 


这 个 游戏 必须 处 理 中 断 。 可 能 当 用 户 按 下 一 个 键 的 时 候 程序 正在 移动 一 幅 图 片 ,或 者 
在 处 理 一 个 用 户 输入 的 时 候 , 计 时 器 发 来 一 个 信号 。 如 果 游 戏 支持 双人 游戏 , 当 一 个 人 按键 
的 时 候 程序 可 能 正在 处 理 另 一 个 人 的 输入 。 

中 断 处 理 是 操作 系统 和 系统 软件 的 关键 部 分 。Unix 中 的 软件 中 断 被 称 为 信号 
(signals) 。 现 在 需要 深入 理解 信号 处 理 。 作 为 开始 , 先 回 顾 一 下 早期 的 Unix 信和 号 处 理 模 
型 ,然后 看 看 它 有 些 什么 问题 ,最 后 再 学 习 POSIX (Unix 型 可 移植 操作 系统 接口 ) 的 信号 处 
理 模 型 。 


7.7.1 早期 的 信号 处 理 机 制 


各 种 事件 促使 内 核 向 进程 发 送信 号 。 这 些 事 件 包 括 用 户 的 击 键 、. 进 程 的 非法 操作 和 计 
时 天 到 时 。 第 6 章 介绍 了 早期 的 信号 处 理 模型 。 一 个 进程 调用 signal 在 以 下 3 种 处 理 信和 号 
的 方法 之 中 选择 : | | 

C1) 默认 操作 (一 般 是 终止 进程 ) ,比如 ,signal(SIGALRM,SIG_DFL) 

(2) 忽略 信号 ,比如 ,signal(SIGALRM ,SIG IGN) 

(3) 调用 一 个 函数 ,比如 ,signal(SIGALRM,handler) 


7.7.2 处 理 多 个 信号 


如 果 只 有 一 个 信号 要 处 理 ,原始 的 信号 处 理 模型 足以 应 付 。 如 果 有 多 个 信和 号 到 达 会 发 
生 什么 事情 ?如果 响应 定义 为 终止 (termination) 或 者 是 忽略 (ignore) , 那 结 果 很 清楚 。 但 是 
如 果 是 调用 (invoke) 一 个 函数 来 响应 ,那么 结果 就 不 那么 明显 了 。 

l. 捕 鼠 器 问题 

信号 处 理 函数 有 点 像 捕 鼠 器 。 一 个 信和 号 意味 着 什么 具有 破坏 性 的 事情 发 生 ,并 被 捕获 。 
当 信 和 号 或 老鼠 被 捕获 ,信和 号 处 理 函 数 或 捕 鼠 器 就 失效 了 。 

在 早期 的 版 本 中 ,信号 处 理 函 数 在 另 一 个 方面 也 很 像 捕 鼠 器 : 在 每 次 捕获 之 后 ,都 必须 
重新 设置 它们 。 比 如 : 一 个 信号 处 理 函 数 可 能 如 下 


void handler( int s) 
( 
/*process is vulnerable herex/ 
Signal(SIGINT,handler); /xreset handlerx/ 
/*do work herex/ 


} 


LA ULE AUTRE AEH te, Be FE AE TEE M DE AY, TE SR SEE LSS a BT GE 
有 老鼠 汶 走 了 。 这 一 脆弱 的 间隙 使 得 原 有 的 信号 处 理 不 可 靠 。 有 些 人 称 此 为 “不 可 靠 的 信 
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号 ”, 就 好 像 说 “不 可 靠 的 老鼠 "一样 ,这 倒 有 些 奇 怪 了 。 

2. 设计 一 个 更 好 的 系统 

捕 鼠 喜 问 题 只 是 早期 信号 系统 的 一 个 弱点 。 为 了 能 说 明 问 题 的 复杂 性 ,考虑 以 下 这 些 
实际 生活 中 的 问题 。 ^ 

3. 处 理 多 个 信号 

真实 世界 充满 信号 ,也 就 是 意外 的 打扰 。 假 设 你 在 办 公 室 里 工作 。 电 话 可 能 会 响 , 可 能 
AAWIT ,或 者 火警 响起 。 对 于 这 些 事件 ,可 以 忽略 ,也 可 以 处 理 。 处 理 一 不 电话 意味 着 放 
下 当前 的 工作 ; 拿 起 电话 ,与 打 电 话 的 人 交谈 , 挂 起 电话 ;然后 回去 做 放 在 二 边 的 工作 。 处 理 
敲 门 和 这 很 相似 。 

如 果 来 访 者 在 你 接 电话 的 时 候 敲 门 会 怎样 呢 ? 你 得 放下 电话 , 按 保持 键 ,开门 ,和 来 访 
者 交谈 ,然后 回去 继续 接 电话 。 在 接 完 电 话 之 后 , 回 到 办 公 桌 旁 继续 工作 ， 这 种 情况 下 ,第 
二 个 信号 打 断 了 对 第 一 个 信号 的 处 理 。 

接 下 来 ,正当 你 与 第 一 个 来 访 者 交谈 时 ,第 二 个 来 访 者 来 了 又 该 怎么 办 呢 ? 一 般 情 况 
下 ,第 一 个 人 会 挡住 门 ,这样 第 二 个 大 就 得 等 你 与 第 一 个 人 交谈 完毕 ， 当 你 与 第 一 个 人 交谈 
完毕 ,第 二 个 人 就 可 以 敲 门 了 。 这 种 情况 下 , 称 第 二 个 来 访 者 在 接待 第 二 个 来 访 者 结束 之 前 
被 阻塞 (blocked) 。 

还 有 ， 如 果 来 访 者 来 访 的 时 候 你 正 专注 于 电话 那 头 讲话 所 么 办 ? 当 你 从 门口 回来 重新 
拿 起 电话 ,是 继续 刚才 的 话题 还 是 告诉 对 方 你 已 经 忘记 刚刚 说 到 哪儿 了 ? 

最 后 ,如果 在 你 处 理 火 警 的 时 候 电 话 响 了 或 者 有 人 项 门 又 该 如 何 呢 ? 如 果 一 个 像 火警 
一 样 重要 的 信号 达到 ,你 或 许 希 望 阻 塞 其 他 信和 号 。 就 像 你 在 处 理 火 警 时 不 会 管 电话 铃 是 否 
lS MARA A ARIF. 有 些 时 候 就 算 你 没有 在 处 理事 件 也 不 想 被 其 他 事情 打扰 。 

4. 进程 的 多 个 信号 

进程 要 面 对 的 问题 和 你 要 面 对 的 没有 什么 太 大 不 同 。 想象 一 个 进程 在 它 的 小 屋 ( 内 存 ) 
里 工作 。 如 图 7. 15 Bras, 用户 可 能 通过 按 下 Ctrl - C 来 产生 一 个 ,SIGINT 信和 号 ,或 者 是 
Ctrl - V*/E SIGQUIT 信号 ,或 者 计时 器 到 时 产生 一 个 SIGQLRM f$, 就 像 电 话 和 敲 门 的 
访 者 ,所 有 这 些 信号 可 能 同时 到 达 。 在 Unix 系统 里 ,一 一 个 进程 如 何 响应 多 个 信和 号? 






| ratte - SIGINT handler 
rin Hide TT SIGQUIT handler 
qrtrtüet.e Mr SIGALRM handler 


Maa 


图 7.15 一 个 接收 到 多 个 消息 的 进程 


(1) 处 理 函 数 每 次 使 用 之 后 都 要 被 禁用 吗 ? ( 捕 鼠 器 模型 ) 
(2) 如 果 SIGY 消息 在 进程 处 理 SIGX 消息 时 ,到 达 会 发 生 什么 ? 
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(3) 如 果 进 程 还 在 处 理 前 一 个 SIGX 消息 时 ,第 二 个 SIGX 消息 又 到 来 会 发 生 什 么 ? 第 
三 个 又 到 了 呢 ? 

(4) 如 果 消 息 到 来 时 , 程序 正在 处 理 getchar 或 者 read 之 类 的 输入 而 阻塞 WS Oy? 

不 同 版 本 的 Unix 的 答案 各 不 相同 。 写 一 个 在 各 个 系统 下 都 能 正常 工作 的 程序 很 不 
容易 。 


7.7.3 ”测试 多 个 信号 


系统 是 如 何 回答 这 些 问题 的 ? 编译 并 运行 sigdemo3. c, 看 看 你 系统 中 的 进程 是 如 何 响 
应 信号 组 合 的 : 


/* sigdemo3.c 
* purpose; show answers to signal questions 
* questionl; does the handler stay in effect after a signal arrives? 
* question2; what if a signalX arrives while handling signalX? 
* question3; what if a signalX arrives while handling signalY? 
* question4; what happens to read() when a signal arrives? 


*/ 


# include <stdio.h> 
# include <csignal. h> 


# define INPUTLEN 100 


main(int ac, char x av[ ]) 

( 
void inthandler(int) ; 
void quithandler( int); 
char input[ INPUTLEN|; 


int nchars; 

signal( SIGINT, inthandler ); /* set handler x/ 
signal( SIGQUIT, quithandler ); /* set handler x/ 
do ( 


printf("\nType a message\n") ; 
nchars = read(0, input, (INPUTLEN ~ 1)); 
if ( nchars == -1) 
perror( "read returned an error"); 
else | 
input[nchars] = 'X0'; 
| printf("You typed; % s", input); 


} 
while( strncmp( input , "quit", 4) l= 0); 
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void inthandler(int s) 
( 
printf(" Received signal % d .. waiting\n", s ); 


, 


sleep(2); 

printf(" Leaving inthandler Mn") ; 
void quithandler( int s) 
{ 

printf(" Received signal %d.. waiting\n", s ); 


, 


sleep(3); 
printf(" Leaving quithandler Mn") ; 
) Ş 


试 着 以 不 同 的 方式 常规 输入 和 两 个 信号 生成 键 Ctrl-C 和 Ctrl-\。 特 别 地 ,以 不 同 的 时 
延 , 试 试 以 下 组 合 跟踪 图 7. 16 中 显示 的 函数 的 控制 流 。 
" COMIS OCOC 
(2) Ce 
(3) hello^C Return 
(4) hello Return-C 
(5) "^VAhello^C 


main loop 


^Chandler 


Ahandler 





7.16 跟踪 这 些 函 数 的 控制 流 


这 些 试验 的 结果 显示 了 你 的 系统 是 如 何 处 理 信号 组 合 的 。 

l. 不 可 靠 的 信号 ( 捕 筷 器 ) 

如 果 两 个 SIGINTS 信号 杀 死 了 进程 ,那么 意味 着 你 的 系统 是 不 可 靠 的 信号 : 处 理 函 数 
必须 每 次 都 重 置 。 如 果 多 个 SIGINTS 信和 号 没有 杀 死 进程 ,意味 着 处 理 函 数 在 被 调用 后 还 起 
作用 。 现 代 信 号 处 理 机 制 允许 你 在 两 者 之 间 做 出 选择 。 

2. SIGY 打 断 SIGX 的 处 理 函 数 ( 接 电话 的 时 候 有 人 敲 门 ) 

当 接 连 按 下 Ctrl-C 和 Ctrl-\ 会 看 到 程序 先 跳 到 inthandler ,接着 跳 到 quithandler ,然后 
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再 回 到 inthandler ,最 后 回 到 主 循环 。 你 的 试验 结果 是 如 何 的 ”? 

3. SIGX 打 断 SIGX 的 处 理 函 数 (两 次 敲 门 ) 

这 种 情况 就 像 晴 个 人 来 禹 门 。 有 3 种 处 理 的 方法 : 

(1) 递归 ,调用 同一 个 处 理 函 数 补 ; 

(2) 忽略 第 二 个 信号 ,这 和 没有 呼叫 等 待 功能 的 电话 机 类 似 ; 

(3) 阻塞 第 二 个 信号 直到 第 一 个 处 理 完毕 。 

原来 的 信号 处 理 系统 使 用 方法 (1), 人 允许 递归 调用 。 一 个 更 安全 的 选择 是 方法 (3)。 就 
像 第 二 个 人 来 敲 门 , 第 二 个 信号 被 阻 蹇 而 不 是 忽略 ,直到 第 一 个 信号 被 处 理 完 。 你 的 系统 阻 
塞 第 二 个 信号 吗 ? 还 是 递归 调用 处 理 函 数 ? 你 的 系统 将 多 个 信和 号 排队 吗 ? 

4. 被 中 断 的 系统 调用 ( 接 电 话 的 时 候 有 人 项 门 ) 

这 种 情况 经 常 发 生 。 程 序 经 和 常 在 等 待 输入 的 时 候 接 收 到 信和 号。 在 上 面 那 个 测试 程序 
中 , 主 循环 阻塞 以 等 竺 键盘 的 输入 (read 调用 ) 。 当 输入 中 断 (CCtrl-C) 或 退出 CCtrl-\) 键 , 程 
序 跳 转 到 信号 处 理 函 数 。 当 处 理 肾 数 处 理 完 成 后 ,程序 回 到 主 循 环 , 应 该 回 到 跳 离 的 位 置 。 
但 果真 如 此 吗 ? 如 果 输 入 “hel”, 接 着 按 下 Ctrl-C 然后 再 继续 输入 “lo” 再 回 车 会 如 何 呢 ? 程 
序 看 到 的 是 完整 的 “hello” 还 是 只 有 “lo”? 程序 是 重新 开始 read 还 是 从 read 返回 同时 设置 
errno 到 EINTR? 

是 重新 开始 还 是 返回 呢 ? 在 AT&T B Unix 中 是 返回 并 设置 EINTR 为 一 1( 经 典 模 
式 ) ,而 在 UCB 中 会 自动 的 重新 开始 。 


7.7.4 信号 机 制 其 他 的 弱 氮 


早期 的 信号 系统 还 有 两 个 弱点 。 

d. 不 知道 信号 被 发 送 的 原因 

信和 号 处 理 琐 数 是 一 个 在 信号 到 达 的 时 候 被 调用 的 函数 。 内 核 传 给 处 理 函 数 一 个 信号 数 
字 编 号 。 在 sigdemo3. c rP Kt inthandler 被 调用 时 得 到 一 个 值 为 SIGINT 的 实 参 。 将 信号 
编号 作为 参数 传 给 处 理 函 数 使 一 个 函数 可 以 处 理 多 个 信和 号。 比如 ,在 sigdemo3. c 中 可 以 用 
一 个 处 理 函 数 蔡 代 原 来 的 两 个 处 理 函 数 , 根 据 参 数 来 决定 打印 什么 。 

早期 的 模型 只 告诉 处 理 肾 数 它 被 调用 是 由 什么 类 型 的 信和 号 而 引起 的 ,但 是 没有 告 之 为 
什么 会 生成 信号。 比如 , 几 种 算术 错误 会 引起 浮 点 异常 (floating 一 point exception)。 比 如 除 
数 为 零 .整数 溢出 和 浮 点 下 溢 。 处 理 函 数 需要 知道 问题 的 原因 。 

2. 处 理 函 数 中 不 能 安全 地 阻塞 其 他 消息 

响应 一 个 火警 时 ,一 般 情况 下 会 忽略 电话 铃声 。 假 设想 让 程序 在 响应 SIGINT 时 忽略 
SIGQUIT。 使 用 经 典 信 号 机 制 修改 inthandler, 如 下 所 示 : 


void inthandler(int s) 
=d 
int rv; 


void ( * prev ghandler)0; /*holds prev handlerx/ 


中 这 是 非 显 式 递归 ,因为 处 理 函 数 并 没有 调用 自己 ,但 其 效果 同 普通 的 递归 相似 。 
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prev qhandler - signal(SIGQUIT,SIG IGN); 
/*ignore QUITs«/ 


Signal(SIGQUIT, prev ghandler); /*restore handlerx/ 
} 


这 样 ,在 进入 中 断 处 理 函 数 时 禁用 退出 处 理 函 数 , 在 结束 时 再 重新 使 能 它 。 这 个 方案 有 
两 个 问题 。 第 一 在 调用 inthandler 和 调用 signal 之 间 是 它 的 软肋 所 在 。 这 里 只 是 希望 调用 
inthandler 和 忽略 SIGQUIT 同时 进行 。 第 二 ,这 里 并 不 想 忽略 SIGQUIT ,而 只 是 想 阻 塞 它 
直到 inthandler 处 理 完成 ,如 同 想 在 火警 之 后 再 回来 接 电话 。 在 处 理 完 关键 事件 后 ,还 是 很 
高 兴 看 到 SIGQUIT ARIE. 


7.8 信号 处 理 2: sigaction 


在 过 去 的 几 年 中 ,针对 原来 的 模型 所 产生 的 问题 ,各 种 相关 组 织 开发 出 了 一 些 不 同 的 解 
决 方案 。 这 里 将 只 学 习 POSIX 模型 和 相关 的 系统 调用 。 经 典 的 信和 号 系统 依旧 被 支持 ,而 且 
在 一 些 应 用 中 这 些 就 够 了 。 


7.8.1 处 理 多 个 信号 : sigaction 


TE POSIX 中 用 sigaction 替代 signal。 参 数 非常 相似 。 指 定 什么 信号 将 被 如 何 处 理 。 如 
条 愿意 ,还 能 得 到 这 个 信号 上 一 次 被 处 理 时 的 设置 。 


int sigaction(signalnumber, action, prevaction) 











X PRICE PESE RT, 
sigaction 
县 标 指定 一 个 信和 号 的 处 理 函 数 
头 文 件 # include «signal. h> 
EH EU res —sigaction(int signum, 
const struct sigaction * action, 
struct sigaction * prevaction) ; 
$5 signum 要 处 理 的 信号 
action 指针 ,指向 描述 操作 的 结构 - 
prevaction 指针 ,指向 描述 被 蔡 换 操作 的 结构 


返回 值 一 失败 
| 0 成 功 





第 一 个 参数 signum 指明 想 要 处 理 的 消息 。 第 二 个 参数 action 指向 描述 如 何 响应 信号 
的 结构 体 。 第 三 个 参数 prevaction MW RARE null ud SL ds dis pe] du XS Be EPR DO Rb BS BY 2 
构 体 。 如 果 新 的 操作 设置 成 功 则 返回 0 ,否则 返回 一 

1. 定制 信号 处 理 : struct sigaction 


在 过 去 , 面 对 信号 的 处 理 只 有 简单 的 几 种 选择 : SIG_DFL SIG_IGN 或 者 函数 处 理 。 这 
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些 选 项 在 新 的 系统 中 作为 结构 体 sigaction 的 部 分 定义 依然 提供 。 结 构 体 sigaction 定义 了 如 
何 处 理 一 个 信号 。 以 下 是 这 个 结构 体 的 完整 定义 : 


struct sigaction{ 
/* ge only one of these two x/ 
void ( * sa handler)(); /*SIG_DFL,SIG_IGN, or function x/ 


void ( * sa sigaction)(int,siginfo t x ,void x); /x new handler x/ 


sigset t sa mask; /* signals to block while handling */ 
int sa flags; /* enable various behaviors x/ 


j 


(1) 选择 sa handler 还 是 sa. sigaction? 

首先 ,要 在 老 的 信号 处 理 方式 和 新 的 更 强大 的 信号 处 理 方式 之 间作 出 选择 。 如 果 老 的 
处 理 方式 ( 即 SIG_DFL SIG_IGN 或 者 处 理 函数 ) 就 够 用 了 ,那么 可 以 设置 sa handler 为 其 
中 之 一 。 当 然 ,如 果 指 定 为 旧 的 信号 处 理 方式 ,那么 只 能 得 到 信和 号 编号 。 否 则 ,如 果 设 定 sa_ 
sigaction 为 一 个 处 理 函 数 ,那么 那个 处 理 函 数 被 调用 的 时 候 , 不 但 可 以 得 到 信和 号 编号 而 且 可 
以 获悉 被 调用 的 原因 以 及 产生 问题 的 上 下 文 的 相关 信息 。 两 者 之 间 的 差异 总 结 如 下 。 


使 用 目的 处 理 机 制 : 使 用 新 的 处 理 机 制 : 
struct sigaction action; action.sa handler - handler old; 
struct sigaction action; action. sa_sigaction = handler new; 


如 何 告诉 内 核 你 使 用 的 是 新 的 信号 处 理 方式 ?” 很 简单 ,只 需 设置 sa_flags 的 SA_ 
SIGINFO fy, 

(2) sa flags 

然后 ,决定 处 理 函 数 将 如 何 应 对 前 面 提出 的 4 个 问题 。sa_flags 是 用 一 些 位 来 控制 处 理 
函数 如 何 应 对 上 述 4 个 问题 的 。 相 关 的 细节 可 以 在 手册 上 查 到 。 下 面 是 部 分 列表 。 





标 记 £ Xx 
SA RESETHAND SUH BRR EE. PRERARR RES 
SA_NODEFER 在 处 理 信号 时 关闭 信号 自动 阻塞 。 这 样 就 允许 递归 调用 信号 处 理 
PR BX | 
SA RESTART 当 系 统 调用 是 针对 一 些 慢 速 的 设备 或 类 似 的 系统 调用 ,重新 开始 ,而 
不 是 返回 。 这 样 是 采用 BSD 模式 
SA SIGINFO 指明 使 用 sa. sigaction 的 处 理 函 数 的 值 。 如 果 这 个 位 没有 被 设置 , 那 


么 就 使 用 sa handler 指向 的 处 理 函 数 的 值 。 如 果 sa_sigaction 被 使 用 ， 
传 给 处 理 函数 将 不 只 是 信和 号 编号 ,还 包括 指向 描述 信号 产生 的 原因 和 
条 件 的 结构 体 





(3) sa mask 
最 后 ,决定 在 处 理 一 个 消息 时 是 否 要 阻塞 其 他 信号 。sa_mask 中 的 位 指定 哪些 信号 要 被 
阻塞 。 使 用 sa mask, 可 以 在 逃离 火灾 现场 时 阻塞 电话 呼叫 和 来 访 者 。sa_mask 的 值 包 括 要 





ne——————————————————— eg A 
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被 阻塞 的 信号 集 。 阻 塞 信 号 是 防止 数据 损毁 的 重要 技术 。 下 一 章 将 详细 介绍 这 个 主题 。 

2. 例子 : 使 用 sigaction — 

下 面 的 例子 演示 了 如 何 使 用 sigaction (注意 程序 如 何 做 到 在 处 理 SIGINT 时 阻塞 
SIGQUIT 的 ) : | 


/* sigactdemo.c 


* 


* 


* 


x/ 


purpose; shows use of sigaction() 
feature : blocks ^V while handling ^C 
does not reset ^C handler, so two kill 


# include <(stdio. h> 
# include <csignal. h> 
+ define INPUTLEN i100 


main() 

| | 
struct sigaction newhandler; /* new settings x/ 
sigset t blocked; /* set of blocked sigs x/ 
void inthandler(); /* the handler x/ 
char x| INPUTLEN | ， | 


/* load these two members first x/ 
newhandler.sa handler = inthandler; 

/* handler function «/ 
newhandler.sa flags - SA RESETHAND | SA RESTART; 


/* options */ 


/* then build the list of blocked signals x/ 


sigemptyset(&blocked); /* clear all bits «/ 
sigaddset(&blocked, SIGQUIT); /* add SIGQUIT to list */ 
newhandler.sa mask - blocked; /* store blockmask */ 
if ( sigaction(SIGINT, &newhandler, NULL) == -1) 
perror("sigaction") > 
else 
while( 1 ){ 


fgets(x, INPUTLEN, stdin); 
printf( "input; $ s", x); 


void inthandler(int s) 


{ 


printf("Called with signal % d\n", s); 
sleep(s); 











。 206 * Unix/Linux 编程 实践 教程 


printf("done handling signal % d\n", s) 
j 


试 着 运行 这 个 程序 。 如 果 以 很 快 的 速度 连续 按 Ctrl-C 和 Ctrl~\, 退 出 信号 将 被 阻塞 直 
到 中 断 信 号 处 理 完毕 。 如 果 连 续 按 两 下 Ctrl-C, 进 程 就 将 被 第 二 个 信号 杀 死 。 如 果 想 要 捕 
获 所 有 的 Ctrl-C, 将 SA_RESETHAND 掩 码 从 sa. flags PEP, 


7.8.2 信号 小 结 


一 个 进程 可 能 被 各 种 来 源 的 信号 中 断 。 信 号 可 能 在 任何 时 候 以 任何 顺序 到 达 。signal 
提供 了 一 种 简单 但 是 不 完整 的 信号 处 理 机 制 。POSIX 接口 , 即 sigaction 提供 了 复杂 的 、 明 确 
定义 的 方法 来 控制 进程 如 何 对 各 种 信号 组 合 做 出 反应 。 

现在 已 经 知道 如 何在 程序 中 管理 时 间 和 中 断 。 视 频 游 戏 还 需要 最 后 一 项 技术 : 防止 
混乱 。 


7.9 防止 数据 损毁 (Data Corruption) 


你 有 曾经 被 同时 做 几 件 事情 搞 得 旦 头 转向 并 因此 犯错 误 的 经 历 吗 ”如果 门铃 在 你 寻找 
邮票 的 时 候 响起 ,你 可 能 会 寄 出 一 封 没 有 贴 邮 票 的 信 。 程 序 也 有 同样 的 问题 。 当 它们 正在 
处 理 一 件 事 情 时 被 调用 到 其 他 地 方 , 它 们 就 可 能 会 被 搞 时 以 至 于 把 事情 弄 得 一 团 糟 。 

来 看 看 在 现实 生活 中 中 断 是 如 何 引起 数据 错误 的 。 然 后 学 习 在 程序 中 如 何 防止 这 种 情 
7.9.1 数据 损毁 的 例子 


继续 那个 办 公 室 的 例子 。 项 你 办 公 室 门 的 人 要 把 他 的 名 字 和 地 址 写 到 一 个 列表 里 。 每 
个 人 只 在 列表 的 最 后 添加 一 项 记录 : 姓名 、 街 道 .城市 .省 份 和 邮编 。 考 虑 以 下 两 个 问题 ，。 

第 一 , 当 一 个 人 正在 往 列 表 里 写 信息 时 有 人 打 电 话 来 要 列表 里 的 名 字 和 地 址 。 如 果 你 
将 列表 的 信息 读 给 人 家 ,就 会 有 给 出 不 完整 信息 的 可 能 。 这 可 以 通过 在 受 访 时 挂 掉 电 话 来 
阻止 这 类 错误 的 发 生 。 

第 二 ,考虑 一 个 不 同 的 问题 。 当 一 个 访问 者 刚刚 把 姓名 填 好 ,第 二 个 SIGKNOCK 信号 
到 达 。 如 果 人 允许 递归 的 信号 处 理 , 第 一 个 访 者 要 等 第 二 个 访 者 填 好 他 的 信息 后 再 继续 在 列 
表 的 末尾 填 自 己 余 下 的 信息 。 这 样 列 表 就 包含 了 错误 的 数据 ; 一 条 记录 在 另外 一 条 记录 中 
间 。 这 可 以 通过 一 个 接 一 个 而 不 是 递归 的 接待 访 者 来 防止 这 类 错误 。 

这 两 个 例子 说 明了 在 一 些 情况 下 一 个 操作 不 应 该 被 其 他 操作 打 断 。 在 对 一 个 数据 结构 
‘这 里 是 列表 ) 改 动 结束 之 前 ,其 他 函数 不 能 读 或 写 这 个 数据 结构 。 当 然 ,处 理 像 火警 一 类 的 
信号 是 安全 的 ,因为 这 类 处 理 并 不 读 或 修改 数据 。 


7.9.2 临界 区 (Critical Sections) 
一 段 修改 一 个 数据 结构 的 代码 如 果 在 运行 时 被 打 断 将 导致 数据 的 不 完整 或 损毁 , 则 称 
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这 段 代码 为 临界 区 。 当 程序 处 理 信号 时 ， 必须 决定 哪 一 段 代 码 为 临界 区 ,然后 设法 保护 这 段 
代码 。 临 界 区 不 一 定 就 在 信号 处 理 函 数 中 ,很 多 出 现在 常规 的 程序 流 中 。 保 护 临 界 区 的 最 
简单 的 办 法 就 是 阻塞 或 忽略 那些 处 理 函 数 将 要 使 用 或 修改 特定 数据 的 信和 号。 


7.9.3 阻塞 信号 : sigprocmask 和 sigsetops 


可 以 在 信号 处 理 者 一 级 或 进程 一 级 阻塞 信号 。 

l. 在 信号 处 理 者 一 级 阻塞 信号 

为 了 在 处 理 一 个 信和 号 的 时 候 阻 塞 另 一 个 信号 ,要 设置 struct sigaction 结构 中 的 sa mask 
成 员 位 , 它 在 设置 处 理 函 数 时 被 传递 给 sigaction。sa_mask 是 sigset t 类 型 , 它 定义 了 一 个 
信号 集 。 我 们 将 简要 地 解释 这 个 集合 。 

2. 一 个 进程 的 阻塞 信号 

在 任何 时 候 一 个 进程 都 有 一 些 信号 被 阻塞 。 注 意 , 是 阻塞 而 不 是 忽略 。 这 个 信号 集 就 
称 为 信号 挡 板 (signal mask)。 通 过 sigprocmask 可 以 修改 这 个 被 阻塞 的 信号 集 ， 
sigprocmask 作为 一 个 原子 操作 根据 所 给 的 信和 号 集 来 修改 当前 被 阻塞 的 信号 集 : 





sigprocmask 
Ej a 修改 当前 的 信号 挡 板 
头 文件 # include «signal, h> 


函数 原型 int res = sigprocmask( int how, 
| const sigset t * sigs, 
sigset t * prev); 


参数 how ”如 何 修改 信号 挡 板 
sigs ”指向 使 用 的 信和 号 列表 的 指针 
prev ”指向 之 前 的 信号 挡 板 列表 的 指针 (或 为 null) 


—1 失败 
0 成 功 








返回 值 





sigprocmask 修改 当前 的 信号 挡 板 设置 。 当 how 的 值 分 别 为 SIG. BLOCK, SIG _ 
UNBLOCK 或 SIG. SET 时 , x sigs 所 指定 的 信号 将 被 添加 、 删 除 或 替换 。 如 果 prev 不 是 
null ,那么 之 前 的 信和 号 挡 板 设置 将 被 复制 到 * prev 中 。 
3. 用 sigsetops 构造 信号 集 
一 个 sigset_t 是 一 个 抽象 的 信号 集 , 可 以 通过 一 些 函 数 来 添加 或 删除 信和 号。 基本 的 函数 
如 下 : 


sigemptyset(sigset t * setp) 
清除 由 setp 指向 的 列表 中 的 所 有 信和 号。 


sigfillset(sigset t x setp) 


添加 所 有 的 信号 到 setp 指向 的 列表 。 


Sigaddset(sigset t x setp, int signum) 





soe a — MÀ rer tin — 
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添加 signum 到 setp 指向 的 列表 。 


sigdelset(sigset t * setp, int signum) 


从 setp 指向 的 列表 中 删除 signum 所 标识 的 信和 号。 


4. 例子 : 暂时 地 阻塞 用 户 信号 
程序 可 以 用 以 下 代码 来 暂时 地 阻塞 SIGINT 和 SIGQUIT 信号 : 


sigset t sigs,prevsigs; /* define two signal sets x/ 
sigemptyset(&sigs) ; /* turn off all bits */ 
sigaddset(&sigs, SIGINT); /* turn on SIGINT bit x/ 
sigaddset(&sigs, SIGQUIT); /* turn on SIGQUIT bit «/ 


sigprocmask(SIG BLOCK, &sigs, &prevsigs); /x add that to proc mask */ 
// .. modify data structure here.. | 


Sigprocmask(SIG SET, x prevsigs, NULL); /* restore previous mask x/ 


注意 这 里 是 如 何在 修改 一 个 tty 驱动 或 者 文件 描述 符 的 时 候 保 存 先前 的 设置 ,然后 用 保 
存 的 设置 来 恢复 原来 的 信号 挡 板 。 除 非 目 的 就 是 修改 获取 的 资源 ,否则 释放 资源 时 恢复 获 
取 时 的 状态 是 个 好 习惯 。 


7.9.4 重 入 代码 (Reentrant Code): 递归 调用 的 危险 


打 断 别人 登记 ,而 将 自己 的 名 字 和 地 址 插 在 别人 的 记录 中 间 的 例子 引入 另 一 个 与 数据 
损毁 有 关 的 概念 : EARR. 

一 个 信和 叶 处 理 者 或 者 一 个 函数 ,如 果 在 激活 状态 下 能 被 调用 而 不 引起 任何 问题 就 称 之 
为 可 重信 的 。 

在 通过 sigaction 设置 时 ,可 以 通过 设置 SA. NODEFER 位 来 允许 处 理 函 数 的 递归 调用 。 
反之 ,可 以 通过 清除 此 位 来 阻塞 信号 。 如 何 选择 呢 ? | 

如 果 处 理 者 不 是 可 重 人 的 ,必须 阻塞 信号 。 但 是 如 果 阻 塞 信 号 ,就 有 可 能 丢失 信号。 信 
号 不 像 电话 便条 那样 贴 在 那里 等 你 回来 处 理 。 有 些 信 号 是 非常 重要 的 : 丢掉 一 些 是 安全 
的 吗 ? 

是 丢掉 信和 号 还 是 弄 乱 数据 ? 哪个 更 糟 些 ?” 有 没有 办 法 同时 避免 这 两 个 问题 ? 设计 使 用 
信和 号 的 程序 时 ,这 些 是 必须 考虑 的 问题 。 信 号 处 理 上 的 错误 现象 不 很 有 规律 ,尤其 在 系统 处 
于 高 负载 的 情况 下 或 者 在 精确 的 性 能 计量 的 时 候 。 排 错 需 要 理解 信号 处 理 的 工作 机 理 , 还 
要 知道 哪里 可 能 会 有 问题 。 


7.9.5 视频 游戏 中 的 临界 区 


球 匀速 在 屏幕 上 移动 , 磁 到 墙 或 挡 板 就 弹 回 。 用 户 通 过 按键 上 下 移动 挡 板 。 间 隔 计数 
器 控制 球 的 运动 。 用 户 控 制 挡 板 的 输入 就 如 信号 那样 看 上 去 是 无 法 预料 的 事件 。 需 要 在 某 
个 时 刻 阻塞 用 户 输入 吗 ? 有 没有 什么 临界 区 ,其 间 挡 板 不 应 该 移动 吗 ? 在 应 用 所 有 已 学 的 
知识 来 完成 视频 游戏 之 前 , 先 来 看 看 另 一 个 信号 的 来 源 : 其 他 进程 。 
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7.10 kil: 从 另 一 个 进程 发 送 的 信号 
信号 来 自 间隔 计时 器 终端 驱动 .内核 或 者 进程 。 一 个 进程 可 以 通过 kill 系统 调用 向 另 
一 个 进程 发 送信 和 号: 


5 
kill 


目标 向 一 个 进程 发 送 一 个 信号 
头 文件 # include — sys/types, h> 

# include — signal. h> 
函数 原型 int kill(pid_t pid, int sig) 
参数 pid 目标 进程 id 

sig 要 被 发 送 的 信号 
返回 值 | 一 ] -失败 

0 成 功 


一 一 

kill 向 一 个 进程 发 送 一 个 信和 号。 发 送信 号 的 进程 的 用 户 ID 必须 和 目标 进程 的 用 户 ID 
相同 ,或 者 发 送信 号 的 进程 的 拥有 者 是 一 个 超级 用 户 。 一 个 进程 可 以 问 上 自己 发 送信 号。 

一 个 进程 可 以 向 其 他 进程 发 送 任 何 信息 ,包括 一 般 来 自 键盘 .间隔 计时 器 或 者 内 核 的 信 
号 。 比 如 一 个 进程 可 以 向 另 一 个 进程 发 送 SIGSEGV 信和 号 ,就 好 像 目 标 进程 执行 了 非法 内 存 
读 取 。 

Unix 命令 kill 使 用 kill 系统 调用 (如 图 7.17 R). 





图 7. 17 一 个 进程 使 用 kill() 来 发 送信 息 


l. 进程 间 通 信 的 含义 

接受 信号 的 进程 几乎 可 以 设置 任何 信号 的 处 理 者 。 考 虑 一 下 在 收 到 SIGINT 时 就 打印 
OUCH! 的 程序 。 如 果 其 他 进程 向 OUCH! 程序 发 送 SIGINT 又 该 如 何 呢 ? OUCH! 程序 
会 捕获 信和 号, 跳 转 到 处 理 者 ,打印 OUCH! (如 图 7.18 所 示 )。 

更 进一步 。 如 果 第 一 个 程序 设置 一 个 间隔 计时 器 ,计时 器 的 信号 处 理 函 数 向 OUCH! 
程序 发 送 SIGINT 信号 。 这 样 相应 的 处 理 函 数 就 被 调用 ， 从 而 一 个 进程 的 计时 器 控制 了 另 
一 个 进程 的 函数 调用 。 实际 上 ,一 组 进程 可 以 像 橄榄 球 运 动员 传递 向 粮 球 那样 传递 信号 
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signal handlers 





图 7.18 信号 的 复杂 用 法 


2. IPC 信号 设计 : SIGUSR1,SIGUSR2 

Unix 有 两 个 信号 可 以 被 用 户 程序 使 用 。 它 们 是 SIGUSRI 和 SIGUSR2。 这 两 个 信号 没 
有 预定 义 任务 。 可 以 使 用 它们 以 避免 使 用 已 经 有 预定 义 语 义 的 信和 号 。 

将 在 后 面 几 章 学 习 进 程 间 通信 。 编 程 时 可 以 有 很 多 方法 组 合 使 用 kill 和 sigaction。 


7.11 使 用 计时 如 和 信号 : 视频 游戏 
现在 回 到 视频 游戏 。 游 戏 有 两 个 主要 元 素 ; 动画 和 用 户 输入 。 动 画 要 平滑 ,用 户 输入 会 
改变 运动 状态 。 下 一 个 程序 bounceld.c 让 用 户 可 以 将 字符 串 在 屏幕 上 弹 来 弹 去 。 
7.11.1 bounceld.c: 在 一 条 线 上 控制 动画 


首先 来 看 看 bounceld 看 上 去 是 什么 样子 。 界 面 如 图 7. 19 所 示 。bounceld. c 将 一 个 单 
词 平滑 地 在 屏幕 上 移动 。 当 用 户 按 下 空格 键 ,单词 就 向 反方 向 移动 。“s?” 键 和 ” 弛 键 分 别 增 加 
和 减少 单词 的 移动 速度 。 按 “Q” 键 退出 程序 。 






=hellof 
退出 


减速 加 速 


7. 19 bounceld 的 运行 界面 : 用 户 控 制 的 动画 


Y 


这 个 程序 是 如 何 实现 的 呢 ? 我 们 已 经 知道 如 何 实现 动画 。 在 一 个 地 方 画 一 个 字符 串 ， 
等 几 毫 秒 ; 然 后 擦 去 旧 的 影像 并 在 原来 位 置 的 左边 或 右边 一 个 单位 距离 重新 画 同一 个 字符 
串 。 这 里 希望 擦 去 和 重 画 动作 以 相同 的 间隔 连续 的 进行 。 所 以 使 用 间隔 计时 器 来 调用 相应 
的 处 理 函 数 。 

两 个 变量 分 别 记 录 移 动 的 方向 和 速度 。 设 置 方向 变量 的 值 为 十 1 和 一 1 分 别 表示 向 左 
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和 向 右 移动 。 延 时 变量 记录 间隔 计时 器 的 间隔 长 度 。 较 长 的 延 时 意味 着 较 慢 的 速度 ,反之 
则 意味 着 较 快 的 速度 。 

现在 向 程序 添加 方向 和 速度 控制 。 根 据 用 户 的 键盘 输入 修改 方向 和 速度 变量 。 程 序 的 
逻辑 如 图 7. 20 所 示 。bounceld 体现 了 两 个 重要 的 技术 : 状态 变量 和 事件 处 理 。 记 录 位 置 、 
方向 和 延 时 的 变量 定义 了 动画 的 状态 。 用 户 输入 和 计时 器 信号 是 改变 这 些 状态 的 事件 。 每 
次 计时 器 到 达 信 和 号 就 调用 改变 位 置 的 处 理 函 数 。 每 次 得 到 用 户 键盘 输入 信号 就 调用 改变 方 
向 和 速度 变量 的 代码 。 以 下 是 它 的 代码 。 | 


流 到 信号 处 理 


正常 的 控制 流 ”函数 再 返回 ”状态 变量 












col dir 






=, on tickor() 





图 7.20 用 户 输入 改变 变量 值 而 变量 值 控制 动作 


/* bounceld.c 
* purpose animation with user controlled speed and direction 
* note the handler does the animation 
* the main program reads keyboard input 
* compile cc bounceld.c set ticker.c - l curses - o bounceld 
x/ 


# include <stdio.h> 
i include < curses. h> 
# include <signal. h> 


/* some global settings main and the handler use x/ 


# define MESSAGE "hello" 
# define BLANK " 


int row; /x current row x/ 
int col; /x current column x/ 


int dir; /x where we are going */ 


int main() 


{ 
int delay; /* bigger => slower x/ 


int ndelay; /* new delay x/ 
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int c; /* user input x/ 
void move msg(int); /* handler for timer x/ 
initscr(); 
crmode() ; 


noecho() ; 


clear(); 

row = 10; /* start here x/ 

col = 0; 

dir = 1; /* add 1 to row number x/ 
delay = 200; /* 200ms = 0.2 seconds x/ 


move(row,col); 
addstr( MESSAGE) ; 


/* get into position x/ 


/* draw message x/ 


Signal(SIGALRM, move msg ); 


set ticker( delay 5; 





while(1) 
{ 
ndelay = 0; 
Cc = getch(); 
if (c == 'Q') break; 
if (c == '') dir = -dir; 
if (c == 'f1 && delay > 2 ) ndelay = delay/2; 
if (c == 's') ndelay = delay * 2; 


if ( ndelay > 0 ) 
set ticker( delay = ndelay ) ， 


j 
endwin(); 


return 0; 


void move msg(int signum) 
( 
Signal(SIGALRM, move msg); 
move( row, col ); 
addstr( BLANK ); 
col + = dir; 
move( row, col ); 
addstr( MESSAGE ) ; 


refresh() ; 


/* reset, just in case x/ 


/* move to new column x/ 
/* then set cursor x/ 
/* redo message x/ 


/* and show it x/ 


/* 

* now handle borders 

*/ 

if ( dir == -1 && col <= 0) 
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dir = 1 $ 
else if ( dir == 1 &&col+strlen(MESSAGE) >= COLS ) 
dir me] ~ 


j 


1. 递归 还 是 阻塞 : 一 个 真实 的 例子 

在 学 习 信 和 号 处 理 函 数 的 数据 损毁 时 提 到 过 重 入 函数 。bounceld 提供 了 一 个 考察 这 个 问 
题 的 真实 例子 。 开 始 时 信号 处 理 函 数 move msg 每 秒 钟 被 调用 WR. PROP’ BER IU a 
延 时 以 增加 动画 速度 。 如 果 按 很 多 次 “f” 键 ,两 次 计时 器 消息 之 间 的 间隔 可 能 比 一 次 处 理 孙 
数 的 执行 时 间 还 要 短 。 如 果 计 时 器 消息 在 处 理 函 数 忙于 擦 去 和 重 画 字符 串 时 到 达 又 会 如 何 ? 

这 个 问题 的 分 析 留 作 习 题 。 在 这 个 程序 中 使 用 signal, 到底 是 递归 还 是 阻塞 依赖 于 你 的 
系统 。 

2. 下 一 步 做 什么 ? 

如 何 扩展 bounceld 为 一 个 弹 球 游戏 ? 首先 ,要 用 “0O? 来 替换 “hello”, 因 为 "DO? 更 像 一 个 
球 。 然 后 ,要 让 球 在 左右 移动 之 外 还 可 上 下 移动 。 为 了 增加 上 下 移动 的 能 力 要 添加 状态 变 
量 。 现 在 已 经 有 col 和 row 来 记录 球 的 位 置 ,dir 来 记录 水 平移 动 方向 。 如 果 要 使 球 能 上 下 
移动 ,还 要 添加 什么 变量 呢 ? 


7.11.2 bounce2d.c: 两 维 动画 
程序 bounce2d 产生 两 维 的 动画 ,可 以 让 用 户 控制 水 平 速度 和 垂直 速度 ,如 图 7. 21 所 示 。 





H .反弹 
| REID 


图 7.21 两 维 动画 


bounce2d 的 3 个 设计 部 分 与 bounceld 相同 。 
(1) 计时 器 驱动 

”间隔 计时 器 被 设置 为 产生 固定 的 SIGALRMS 信和 号 流 。 响 应 一 个 信号 , 球 向 前 移动 
一 步 。 
(2) 等 待 键盘 输入 
程序 阻塞 等 待 键盘 输入 。 根 据 用 户 按 下 的 键 的 不 同 采取 不 同 的 动作 。 

(3) 状态 变量 
变量 记录 了 球 的 速度 和 方向 。 用 户 输入 修改 的 变量 值 决 定 了 小 球 的 速度 。 计 时 器 处 理 








。 214 * Unix/Linux 编程 实践 教程 





函数 根据 速度 和 位 置 变 量 来 决定 在 何 时 何 处 画 小 球 。 

看 起 来 都 很 像 bounceld。 但 这 里 有 一 点 不 同 ,这 是 一 个 重要 的 问题 , 如何 让 球 斜 着 
移动 ? 

让 球 斜 着 移动 是 一 个 新 间 题 。 在 一 维 的 程序 中 ,每 个 计时 器 信号 促使 影像 在 屏幕 上 移 
动 一 个 单位 。 这 样 就 很 简单 : 一 个 信和 号 .一 个 单位 。 但 是 在 两 维 的 动画 中 ,情况 就 不 这 人 么 简 
单 了 。 考 虑 一 下 图 7.22 所 示 的 路 径 。 这 种 情况 下 ,每 垂直 移动 一 个 单位 ,水 平移 动 3 个 单 
位 。 一 种 方法 是 在 收 到 每 个 计时 器 信号 时 将 影像 从 A 移动 到 B。 当 两 个 直角 边 成 一 定 比 例 
时 ,影像 的 跳跃 可 能 比较 大 。 比 如 当 比 例 为 3/4 时 每 次 跳跃 达到 5 个 单位 。 


||| B|] mm meseoremsi a 
p | 

A L^ 动 到 单元 B? 
Lr 


图 7. 22 直角 边 之 比 为 1/3 的 移动 路 径 










每 次 移动 一 个 单位 看 起 来 比较 好 。 当 直角 边 的 比 为 1/3 的 时 候 , 影 像 如 图 7. 23 那样 一 
个 单位 一 个 单位 的 移动 。 注意, 影像 每 横向 移动 3 个 单位 纵向 就 移动 一 个 单位 。 横 向 移动 的 
步 数 是 纵向 移动 步 数 的 3 f. 

这 样 看 起 来 像 有 两 个 计时 器 。 考 虑 只 有 一 个 计时 器 。 每 隔 两 个 时 钟 信号 影像 向 右 移动 
一 个 单位 。 每 隔 6 个 时 钟 信号 程序 将 影像 向 上 移动 一 个 单位 。 这 样 球 就 会 斜 着 移动 。 如 果 
时 钟 间隔 单位 分 别 为 10 和 30 的 话 , 那 么 球 移动 的 路 径 相同 ,就 是 慢 些 。 一 个 程序 只 有 一 个 
真实 的 间隔 计时 器 ,所 以 要 构造 两 个 自己 的 计时 器 。 这 两 个 自己 的 计时 器 是 由 真实 的 间隔 
计时 器 驱动 。 这 里 采用 图 7.23 所 示 的 逻辑 来 驱动 两 维 动画 。 


为 了 模拟 对 角 线 移动 ,需要 . 

每 两 个 计时 器 信和 号 向 右 移动 一 个 单位 ,每 六 个 
计时 器 信号 向 上 移动 一 个 单位 。 

这 种 的 技术 需要 两 个 计时 器 。 一 个 记录 不 平 
移动 的 计时 器 信和 号 数 ,一 个 记录 垂直 移动 的 计 
时 器 信号 数 。 





图 7.23 每 次 移动 一 个 单位 更 好 


为 了 能 同时 在 两 个 方向 移动 ,用 两 个 计数 器 来 充当 计时 器 。 就 像 系统 的 间隔 计时 器 由 
两 部 分 组 成 一 样 ,每 个 计数 器 都 有 两 个 属性 : 当前 值 和 间隔 。 当 前 值 表示 在 下 次 重 画 之 前 还 
要 等 待 多 少 个 计时 信号 。 间 隔 指明 两 次 移动 之 间 所 要 等 待 的 计时 信和 号 个 数 。 两 个 成 员 变量 
分 别 命名 为 ttg 和 ttm。 代 码 如 下 


/* bounce2d 1.0 


* bounce a character (default is 'o') around the screen 
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* defined by some parameters 
* 


* user input. s slow down x component, S: slow y component 


x f speed up x component, F; speed y component 
* Q quit 
* 


* blocks on read, but timer tick sends SIGALRM caught by ball move 
* build; cc bounce2d.c set ticker.c - lcurses - o bounce2d 

x/ 

# include <curses. h> 

# include <(signal.h> 


4 include "bounce. h" 
struct ppball the ball: 
/* * the main loop * x / 


void set_up(); 


void wrap upO; 


int main() 
( 
int c; 
set upO; 
while ( (c = getchar()) [= 'Q' ){ 
if (c == (f) the ball.x ttm-- |; 
else if (c == 'g! )the ball.x ttm 十 十 ; 
else if ( c == 'F')the ball.y ttm-- ; 
else if (c == 'S')the ball.y ttm+ł+; 
} 
wrap up(); 


void set_up() 
/* 
* init structure and other stuff 
*/ 
{ 
void ball move(int); 


the ball.y pos = Y INIT; 
X INIT; 
the ball. y ttm = Y TTM ; 


the ball.x ttm = X TTM ; 
1 


the ball.x pos 
the ball.y ttg 
the ball.x ttg 
the ball.y dir 


f 


*- 
F 
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j 


the ball.x dir = 1; 
the ball.symbol - DFL SYMBOL ; 


initscr(); 
noechoC ) ; 


crmode() ; 


signal( SIGINT , SIG IGN ); 
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mvaddch( the ball.y pos, the ball.x pos, the ball.symbol); 


refresh(); 


signal( SIGALRM, ball move ); 
set ticker( 1000 / TICKS PER SEC ); 


/* send millisecs per tick x/ 


void wrap up() 


{ 


set ticker( 0); 


endwin(); 


void ball move(int signum) 


{ 


int y cur, x cur, moved; 


signal( SIGALRM , SIG IGN ); 
y Cur = the ball.y pos ; 
X cur = the ball.x pos ; 


moved = 0 ， 


F 


if ( the ball.y ttm — 0 && the ball.y ttg-- 
the ball.y pos *- the ball.y dir ; 
the ball.y ttg - the ball.y ttm; 
moved = 1; 

} 

if ( the ball.x ttm > 0 && the ball.x ttg-- 
the ball.x pos += the ball.x dir ; 
the ball.x ttg - the ball.x ttm; 
moved = 1; 

} 

if ( moved )| 
mvaddch( y cur, x cur, BLANK ); 
mvaddch( y cur, x cur, BLANK ); 


/* 


/* 
/* 


put back to normal x/ 


dont get caught now x/ 
old spot */ 


mom 1 >{ 


/* 
/* 


-r = 


/* 
/* 


move */ 


reset x/ 


1)1 
move x/ 


reset x/ 


mvaddch( the ball.y pos, the ball.x pos, the ball. symbol ) ， 


bounce or lose( &the ball); 
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move(LINES ~ 1,COLS - 1); 
refresh{) ; 


) 
signal( SIGALRM, ball move); 


/* for unreliable systems x/ 


int bounce or lose(struct ppball * bp) 


{ 


int return_val = 0; 


F 


if ( bp->y_pos == TOP ROW ){ 


bp->y_dir = 1; 


return val = 1; 


} else if ( bp->y_pos == ROT ROW ){ 


bp ->y dir = —1; 


return val - 1; 


} 


if ( bp->x_pos == LEFT EDGE ){ 


bp —^x dir = 1; 


return val = 1; 


| else if ( bp —»x pos == RIGHT EDGE ){ 


bp —»2x dir 


return val 


return return val; 


} 


头 文件 为 ; 


/* bounce. h x/ 


= -1; 


= 1. 


f 


/* some settings for the game x/ 


H define BLANK ' 
# define DFL SYMBOL 
# define TOP ROW 5 


#define BOT ROW 20 


to! 


# define LEFT EDGE 10 


# define RIGHT EDGE 
#define X INIT 10 
# define Y INIT 10 
# define TICKS PER SEC 


# define X TIMM 5 
# define Y TTM 8 


70 


/* starting col  x/ 
/* starting row  x/ 


50 /* affects speed x/ 
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/* * the ping pong ball 关 关 / 
struct ppball | 
int y pos, x pos, 
y ttm, x ttm, 
y ttg, x ttg, 
y dir, x dir; 
char symbol ; 


7.11.3 完成 游戏 


璋 下 的 工作 作为 练习 留 给 读者 。 需 要 添加 挡 板 控制 球 的 代码 ,将 球 从 挡 板 弹 回 的 代码 ， 
判断 球 是 否 已 经 飞 出 界 的 代码 等 。 | 

到 在 为 止 已 经 学 习 了 所 有 实现 游戏 所 需要 的 技能 。 小 心 期 酮 代码 的 重 人 人 问题。 什么 地 
方 的 代码 会 在 一 个 时 间 多 次 被 调用 ? 想 让 计时 器 处 理 函 数 设计 成 递归 调用 的 ,还 是 阻塞 后 
面 的 信号 ? 


7.12 输入 信和 号: 异步 IO 


本 章 的 动画 和 游戏 等 待 两 类 事件 : 计时 器 信号 和 键盘 输入 。 设 置 间 隔 计时 器 的 处 理 函 
数 来 控制 动画 ,通过 调用 getch 阻塞 程序 以 等 待 键盘 输入 。 除 了 阻塞 ,还 能 像 得 到 计时 器 信 
号 那样 通过 信号 来 得 到 用 户 的 输入 吗 ? 

可 以 的 。 程序 可 以 要 求 内 核 在 得 到 输入 时 发 送信 和 号。 这 有 点 像 要 求 邮 递 员 在 投递 邮件 
时 按 门 铃 。 这 样 你 就 不 用 坐 在 大 门 前 整 天 盯 着 邮件 箱 而 干 些 其 他 什么 事情 或 者 睡觉 。 任 何 
时 候 只 要 一 有 信和 到 你 就 能 知道 。 

Unix 有 两 个 异步 输入 (asynchronous input) 系 统 。 一 种 方法 是 当 输 入 就 绪 时 发 送信 号 ， 
为 一 个 系统 当 输 入 被 读 人 时 发 送信 号 。UCB 中 通过 设置 文件 描述 块 (file descriptor) 的 OO_ 
ASYNC 位 来 实现 第 一 种 方法 。 第 二 种 方法 是 POSIX 标准 , 它 调用 aio read, F ja) 2E 2J iX 
两 种 方法 。 首 先 , 来 看 看 这 么 做 的 想法 。 


7.12.1 使 用 异步 I/O 


新 版 本 的 反弹 程序 如 图 7.24 所 示 。 需 要 两 种 信和 号; SIGIO 和 SIGALRM, 所 以 要 建立 
两 个 处 理 图 数 。SIGIO 处 理 函 数 读 和 人 击 键 并 根据 读 人 的 数据 采取 行动 。SIGALRM AH K 
数 驱动 动画 并 检测 碰撞 。 为 简单 起 见 ,去掉 了 速度 控制 ， 


7.12.2 方法 1: 使 用 O_ ASYNC 


使 用 O_ASYNC 需要 对 原 有 的 弹 球 程序 做 4 处 改动 。 首 先 要 建立 和 设置 在 键盘 输入 时 
被 调用 的 处 理 函 数 。 其 次 ,使 用 fcntl 的 F_SETOWN 命令 来 告诉 内 核发 送 输 入 通知 信号 给 
进程 。 其 他 进程 可 能 也 连接 到 键盘 。 这 里 不 想 让 这 些 进 程 发 送信 号 。 第 三 ,通过 调用 fent 
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col dir data 
i 






on input() 





process 


图 .7. 24 键盘 和 计时 器 都 发 送信 和 号 





来 设置 文件 描述 符 0 中 的 O_ASYNC 位 来 打开 输入 信和 号。 最 后 ,循环 调用 pause 等 待 来 自 计 
时 天 或 键盘 的 信号 。 当 有 一 个 从 键盘 来 的 字符 到 达 , 内 核 向 进程 发 送 SIGIO 信号 。SIGIO 
的 处 理 函 数 使 用 标准 的 curses 函数 getch 来 读 人 这 个 字符 。 当 计时 器 间隔 超时 ， 内 核发 送 以 
前 已 经 处 理 的 SIGALRM 信和 号。 以 下 是 源 代码 : 


/* bounce async.c 
* purpose animation with user control, using O ASYNC on fd 
* note set ticker() sends SIGALRM, handler does animation 
x keyboard sends SIGIO, main only calls pause() 
.* compile cc bounce async.c set ticker.c - l curses - o bounce async 
x/ 
# include <stdio.h> 
# include <curses. h> 
# include <signal. h> 
# include <fcntl.h> 


/* The state of the game x/ 


# define MESSAGE "hello" 
# define BLANK non 


int row = 10; /* current row x/ 
int col = 0; /x current column  x/ 
intdir = 1; /* where we are going x/ 


int delay - 200 /* how long to wait x/ 


int done = 0 


main( ) 
E 


void on alarm(int); /* handler for alarm x/ 
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void on input(int); 


void enable kbd signals(); 


initscr(); 
crmode(); 
noecho() ; 


clear( ) ; 


signal(SIGIO, on input); 


enable kbd signals(); 


Signal(SIGALRM, on alarm); 


set ticker(delay); 


move(row,col); 
addstr( MESSAGE ); 


while( ! done ) 
pause() ; 
endwin(); 
j 
void on input(int signum) 
{ 
int c = getch(); 


if (c == 'Q' || c == EOF) 
done = 1; 
elseif (ce == !') 
dir = - dir; 


void on alarm(int signum) 


{ 


Signal(SIGALRM, on alarm); 
mvaddstr( row, col, BLANK ); 


col += dir; 


mvaddstr( row, col, MESSAGE ); 


refresh(); 


/* 
x now handle borders 


*/ 


if (dir == -1 && col <= 0) 


dir = 1. 


F 


/* 


/* 


/* 


/* 
/* 


/x 
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handler for keybd x/ 


set up screen x/ 


install a handler x/ 
turn on kbd signals x/ 
install alarm handler x/ 
start ticking */ 


get into position x/ 


draw initial image «/ 


the main loop «/ 


grab the char x/ 


reset, just in case */ 
note mvaddstr() x/ 
move to new column x/ 
redo message x/ 


and show it x/ 


else if ( dir == 1 && col + strlen(MESSAGE) >= COLS ) 


dir = - 1; 
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/* 
* install a handler, tell kernel who to notify on input, enable 
x signals 
x/ 
void enable kbd signals() 
{ 
int fd_flags; 


fcntl(0, F_SETOWN, getpid()); 
fd flags = fontl(0, F GETFL); 
fcntl(0, F SETFL, (fd flags|O ASYNC)); 


7.12.3 方法 2: 使 用 aio read 


相 比 设置 文件 描述 符 的 O_ASYNC 位 ,使 用 aio. read 更 加 灵活 ,当然 也 复杂 些 。 对 原来 


的 弹 球 程序 做 4 处 改动 。 


| 第 一 ,设置 输入 被 读 入 时 所 调用 的 处 理沙 数 on input, 
第 二 ,设置 struct kbcbuf 中 的 变量 来 指明 等 待 什么 类 型 的 输入 , 当 输 入 发 生 时 产生 什么 


信号。 在 这 个 简单 的 程序 中 ,需要 从 文件 描述 符 0 中 读 人 一 个 字符 , 当 字符 被 读 人 时 希望 收 
到 SIGIO 信和 号。 实际 上 能 指定 任何 信号 ,甚至 是 SIGARLM 或 SIGINT。 | 


第 三 ,通过 将 以 上 定义 的 结构 体 传 给 aio read 来 递交 读 人 和 人 请求。 和 调用 一 般 的 read 不 


同 ,aio_read 不 会 阻塞 进程 。 相 反 aio read 会 在 完成 时 发 送信 和 号。 


现在 这 个 程序 可 以 做 任何 它 想 做 的 事情 了 。 在 下 面 这 个 简单 的 例子 中 ,只 是 调用 pause 


来 等 待 信号 。 当 用 户 输入 字符 ,aio_read 向 进程 发 送 SIGIO 信和 号 ,响应 处 理 函 数 被 调用 。 





最 后 ,实现 处 理 函 数 , 函数 通过 调用 aio_return 来 得 到 输入 的 字符 。 然 后 处 理 这 个 字符 。 


/* bounce aio.c 
* purpose animation with user control, using aio read() etc 
* note set ticker() sends SIGALRM, handler does animation 
* keyboard sends SIGIO, main only calls pause() 
x compile cc bounce aio.c set ticker.c — lrt - lcurses -o bounce aio 
*/ 
# include <Cstdio. h> 
# include <ccurses. h> 
# include <Csignal. h> 
# include <aio. h> 


/* The state of the game x/ 


+ define MESSAGE "hello" 
# define BLANK  " " 


int row - 10; /* current row x/ 
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int col - 0; /x current column x/ 
int dir - 1; /x where we are going «/ 
int delay - 200; /x how long to wait «/ 
int done = 0; 
struct aiocb kbcbuf; /* an aio control buf x/ 
main() 
{ 
void on alarm(int); /* handler for alarm x/ 
void on input(int); /* handler for keybd x/ 


void setup aio buffer(); 


initscr(); /* set up screen x/ 

crmode(); 

noecho() ; 

clear(); 

Signal(SIGIO, on input); /* install a handler x/ 
setup aio buffer(); /* initialize aio ctrl buff x/ 
aio read(&kbcbuf); /* place a read request *#/ 
Signal(SIGALRM, on alarm); /*install alarm handler «/ 
set ticker(delay); /* start ticking 


mvaddstr( row, col, MESSAGE ); /* draw initial image «/ 


while( ! done ) /* the nain loop x/ 
pause(); 
endwin() ; 
} 
/* 
* handler called when aio read() has stuff to read 
* First check for any error codes, and if ok, then get the return code 
*/ 
void on input() 
{ 
int c; 
char *cp = (char *) kbcbuf.aio buf; /x cast to char x x / 


/* check for errors x/ 

if ( aio error(&kbcbuf) != 0) 
perror( "reading failed"); 

else 
/* get number of chars read x/ 
if ( aio return(&kbcbuf) == 1) 
| 
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c = *cp; 
if (c == 'Q' || c == EOF) 
done = 1; 
else if (c == '') 
dir = - dir; 


/x place a new request x*/. 


aio read(&kbcbuf); 


void on alarm() 


{ 


Signal(SIGALRM, on alarm); /* reset, just in case x/ 
mvaddstr( row, col, BLANK ); /* clear old string */ 
col += dir; /* move to new column x/ 
mvaddstr( row, col, MESSAGE ); /* draw new string */ 
refresh(); /x and show it x/ 
/* | 

* now handle borders 

*/ 

if (dir == -1 && col <= 0) 

dir = 1; 


f 


else if ( dir == 1 && col + strlen(MESSAGE) >= COLS) 
dir = -1; 
} 
/* 
* set members of struct. 
* First specify args like those for read(fd, buf, num) and offset 
* Then specify what to do (send signal) and what signal (SIGIO) 
*/ 
void setup aio buffer() 


| 


static char input[1]; /* 1 char of input x/ 
/* describe what to read x/ | 
kbcbuf.aio fildes - 0; /x standard intput x/ 
kbcbuf.aio buf - input; /* buffer x/ 
kbcbuf.aio nbytes = 1; /* number to read x/ 
kbcbuf.aio offset - 0; /* offset in file x/ 


/* describe what to do when read is ready x/ 
kbcbuf.aio sigevent.sigev notify - SIGEV SIGNAL; 
kbcbuf.aio sigevent.sigev signo = SIGIO; /x send sIGIO x/ 
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7.12.4 弹 球 程序 中 需要 异步 读 入 四 


不 。 用 户 和 输入 阻塞 程序 ,间隔 计时 器 驱动 球 移 动 的 模式 工作 的 很 好 。 异 步 读 和 的 优势 
在 于 程序 不 用 被 输入 阻塞 而 可 以 做 些 其 他 什么 。 

比如 一 个 更 有 想象 力 的 程序 可 以 用 这 段 时 间 放 音乐 .生成 声响 效果 .计算 复杂 的 背景 图 
案 , 甚 至 于 做 一 些 公 共 服 务 。 越 来 越 多 的 计算 机 贡献 出 空 亲 时 间 来 帮助 计算 数学 、 天 文学 或 
医学 领域 的 一 些 大 计算 量 的 工作 。 

弹 球 程 序 可 以 用 它 的 空闲 时 间 计 算 任 意 精 度 的 pi 值 ,用 异步 输入 来 响应 用 户 的 键盘 输 
A. Xf main 中 的 循环 做 以 下 修改 : 


改动 之 前 的 程序 : 改动 之 后 的 程序 : 
while(! done) compute piO; 
pause(); endwin(); 


endwin(; 


修改 后 监督 程序 调用 函数 来 计算 pi 值 。 当 接收 到 一 个 字符 ,程序 跳 至 处 理 函 数 来 处 理 
答 入 ,然后 继续 计算 。 当 接收 到 一 个 计时 器 间隔 消息 ,程序 跳 到 相应 的 处 理 函 数 去 处 理 计 时 
消息 ,处 理 结束 后 继续 计算 pi 值 。 

如 这 个 程序 需要 用 新 的 方法 来 处 理 “Q” 键 被 按 下 的 消息 。 怎 样 修改 程序 来 达到 这 个 目 
的 呢 ? 


7.12.5 异步 输入 、 视 频 游 戏 和 操作 系统 


本 章 开 始 的 时 候 对 视频 游戏 和 操作 系统 做 了 对 比 。 本 章 的 弹 球 游戏 不 需要 异步 输入 ， 
但 操作 系统 需要 。 内 核 要 运行 程序 而 不 能 把 时 间 浪 费 在 等 待 用 户 输入 上 。 内 核 设 置 当 键 
盘 、 串 口 或 网 卡 得 到 输入 时 被 调用 的 处 理 函 数 。 内 核 从 一 个 运行 中 的 程序 跳 转 到 处 理 函 数 ， 
处 理 输入 ,再 跳 回 运行 中 的 程序 。 在 临界 区 ,内 核 阻 塞 信号。 

内 核 的 异步 输入 是 由 硬件 实现 的 ,而 进程 的 异步 输入 是 由 软件 实现 的 。 它 们 之 间 有 
什么 联系 吗 ? 游戏 正在 运行 。 突 然 用 户 按 下 一 个 键 , 一 个 电子 信和 号 被 送 到 键盘 端口 。 键 
盘 端 口 产 生 一 个 真实 的 硬件 信号 。 这 个 信号 引发 控制 从 视频 游戏 的 运行 中 转 到 键盘 的 设 
备 驱 动 。 

内 核 的 设备 驱动 代码 从 输入 端口 读 人 字符 ,然后 将 读 和 的 字符 通过 终端 驱动 进行 处 理 。 
如 采 驱 动 的 文件 描述 符 被 设置 为 异步 输入 ,内 核 向 进程 发 送信 号 。 当 进程 继续 运行 时 ,控制 
转移 到 进程 内 的 信号 处 理 函 数 。 


小 结 
1. ERAS 


”有 些 程序 的 控制 流 很 简单 。 而 另外 一 些 则 要 响应 外 部 的 事件 。 一 个 视频 游戏 要 响应 
时 钟 和 用 户 输入 。 操 作 系 统 也 要 响应 时 钟 和 外 设 。 
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* curses JE fg — #6 n] pA EF EB BE ae b o SERE BJ BRL 
。 一 个 进程 通过 设置 计时 器 来 安排 事件 。 每 个 进程 有 3 个 独立 的 计时 器 。 计 时 器 通过 
发 送信 号 来 通知 进程 。 每 个 计时 器 都 可 以 被 设置 为 只 发 送 一 次 信号 ,或 者 按 固定 的 
间隙 发 送信 和 号。 
。 处 理 一 个 信号 很 简单 。 同 时 处 理 多 个 信号 就 复杂 些 了 。 进 程 能 决定 是 忽略 信号 还 是 
阻塞 信号 。 进 程 能 够 告知 内 核 哪些 信号 在 什么 时 候 阻 塞 或 忽略 。 
。 有 些 函 数 执行 一 些 复杂 的 任务 是 不 能 被 打 断 的 。 程 序 可 以 通过 小 心地 使 用 信号 掩 码 
来 保护 这 些 临界 区 代码 。 
2. 进一步 的 问题 
本 章 中 ,了 解 到 视频 游戏 是 如 何 通过 接收 和 处 理 信号 来 同时 做 几 件 事情 的 。Unix 同时 
运行 几 个 程序 。 进 程 是 如 何 运行 的 ? 进程 来 自 何 处 ? 下 面 将 注意 力 从 操作 系统 的 基本 概念 
和 原则 转 到 如 何 创建 进程 .如 何在 进程 间 通 信 这 些 细节 上 。 
3， 习 题 | 
7.1 pause 等 待 任何 信号 的 到 达 , 包 括 从 键盘 生成 的 信号 ,比如 SIGINT. 


7.2 


7.3 


7.4 


7.5 


7.6 


(1) 运行 sleep] 然后 按 下 Ctrl-C。 会 有 什么 现象 ? HHA? 
(2) 修改 sleep] 以 处 理 SIGINT, 
(3) 再 运行 程序 , 按 下 Ctrl-C 又 会 如 何 ? WHA? 


在 有 些 情况 下 , 慢 速 设备 (Slow Devices) f read 系统 调用 可 以 被 中 断 。 比 如 用 户 
可 以 通过 按 下 Ctrl-C 来 中 断 程序 从 键盘 读 人 。 而 另 一些 情 况 下 ,比如 程序 在 调 
用 read 从 磁盘 读 人 , 按 下 Ctrl - C WIR A HL ZR BEYSHR. 

通过 读 手 册 或 者 查找 Web 来 学 习 有 关 慢 速 设备 的 知识 。 哪 些 read 的 调用 可 以 被 
中 断 ? 哪些 不 能 ?为 什么 ? 


sigprocmask 和 ISIG 另 一 种 方法 来 防止 重 人 临界 区 代码 不 被 键盘 信号 打 断 的 方 
法 是 关 掉 tty 驱动 中 的 ISIG。 这 个 方法 和 在 信号 掩 码 上 添加 这 些 信 号 有 什么 
不 同 ? 


发 明 一 种 可 重 人 的 系统 ,该 系统 支持 人 们 到 你 的 办 公 室 来 将 他 们 的 名 字 和 地 址 登 
记 在 列表 中 。 试 给 出 一 种 算法 ,该 算法 中 信号 处 理 函 数 在 每 次 被 调用 时 向 一 个 文 
本 文件 的 末尾 添加 3 行 数 据 。 看 看 第 5 章 有 关 文 件 自动 增长 模式 (auto-append 
mode) MRH link 来 锁 住 文件 的 练习 。 


讨论 如 果 bounceld. c 中 执行 move msg 一 次 的 时 间 比 计时 器 的 间隔 要 长 的 情况 
下 会 如 何 。 变 量 pos 会 如 何 ? 屏幕 会 有 什么 表现 ?在 阻塞 和 递归 两 种 情况 下 回答 
这 些 问题 。 有 没有 既 不 丢失 信号 同时 又 防止 数据 损毁 的 方法 ? 


在 一 些 版 本 的 Unix 中 ,计时 器 信号 被 处 理 的 话 会 中 断 对 getch 的 调用 。 这 些 系统 
中 被 计时 器 信号 中 断 的 getch 会 返回 EOF。 这 对 程序 有 什么 影响 ”这 些 影响 会 产 
生 问 题 吗 ? 能 弥补 吗 ? 
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异步 输入 版 的 弹 球 有 两 个 信号 处 理 函 数 。 如 果 SIGIO 在 程序 处 理 SIGALRM 的 
时 候 到 达 会 如 何 ? 反之 又 如 何 呢 ? 两 个 处 理 冰 数 会 相互 影响 吗 ? 在 处 理 信和 号 的 
时 候 要 阻塞 其 他 信和 号 吗 ? 递归 调用 又 如 何 ?” 如 果 新 的 字符 在 程序 处 理 SIGIO 时 
到 达 会 不 会 有 问题 ? 

列 出 所 有 可 能 的 组 合 , 同 时 列 出 可 能 引发 的 问题 。 


4. 编程 练习 
7.8 有 些 浏 览 器 支持 闪烁 字符 和 移动 字符 (theater-marquee text)。 修 改 hellol. c 以 显示 


闪烁 字符 。 如 果 用 户 在 命令 行 提供 一 段 字符 串 ,程序 应 该 显示 提供 的 字符 串 ,否则 就 
显示 默认 的 字符 早 。 用 sleep 让 程序 在 打印 和 擦 除 字符 串 之 间 停 顿 。 


7.9 使 用 curses 来 实现 移动 字符 效果 ,并 用 这 个 效果 显示 一 个 文件 的 内 容 。 移 动 字符 
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MAR (Theater Marquee) (或 者 传动 带 效 果 Ticker Tape) 是 在 一 个 水 平 区 域 中 水 平 
地 逐 字 地 滚动 显示 字符 串 。 程 序 应 该 能 从 命令 行 中 读 入 文件 和 名 和 显示 串 的 长 度 、 
位 置 及 速度 。 


修改 hello5. c, 用 usleep 来 替代 sleep ,选择 一 个 能 够 平滑 但 不 太 快 的 移动 时 间 间 
Vs {EL 

修改 程序 使 字符 串 在 屏幕 两 边 移动 变 慢 , 而 到 中 间 就 移动 加 快 。 看 看 程序 产生 
的 轨迹 能 多 接近 单 摆 或 弹 答 上 的 物体 的 简 谐振 动 的 轨迹 。 

想象 屏幕 的 右边 是 行星 ,字符 串 从 太空 落下 。 修 改 程序 使 之 能 模拟 重力 的 加 速 作 
用 。 可 以 做 的 更 加 真实 些 ,在 字符 串 撞 击 地 面 时 碎 裂 成 四 处 飞溅 的 小 字符 。 


程序 ticker demo. c 从 信和 号 处 理 函 数 退 出 。 能 和 否 修改 程序 使 之 从 main 函数 退出 
而 不 是 信号 处 理 函 数 。 添 加 一 个 名 为 done 的 全 局 变量 。 然 后 对 原来 的 程序 再 做 
两 处 修改 使 之 能 从 main 退出 。 两 种 方法 的 利弊 各 是 什么 ? 


修改 sigdemo3. c, 把 两 个 信和 号 处 理 函 数 合 并 成 一 个 。 在 合并 后 的 处 理 尊 数 中 通 
ARARIRE KANE BARR MOU uB 改动 会 对 程序 
的 行为 有 何 影响 ? 


你 有 连 到 远 端 机 器 ,然后 忘 了 退出 的 经 历 吗 ? 一 个 后 台 运 行 的 程序 在 一 定 的 空 

有 内 时间 后 问 登 录 命 令 解 释 进程 发 送 SIGKILL 消息 会 很 有 用 。 

(D 写 程序 timeout. ec。 这 个 程序 接受 命令 行 参数 包括 进程 ID 和 和 秒 数 。 程 序 睡眠 指 
定 的 秒 数 后 向 指定 的 进程 发 送 SIGKILL 信和 号。 可 以 从 命令 解释 进程 用 timeout 
$$ 3600 & 命令 来 启动 程序 。 符 号 ss 表示 命令 解释 进程 的 ID. 

(2) timeout. c 的 问题 是 一 个 小 时 以 后 就 算 你 还 在 工作 它 还 是 会 让 你 退出 。 修 改 
程序 使 之 只 在 你 的 tty 没有 输入 /输出 10 分 钟 以 后 才 退 出 。( 提 示 : /dev/ 
ttyxx 的 修改 时 间 代 表 了 最 后 一 次 从 设备 读 人 或 写 出 数据 的 时 间 。 修 改 程序 
使 之 能 够 以 参数 的 形式 接受 tty HES.) 





7.14 


7.17 
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在 本 练习 中 将 写 一 个 程序 在 用 户 层 模拟 图 7. 14 演示 的 情况 。 说 明 如 何 由 一 
际 时 钟 驱动 两 个 不 同 的 计时 器 。 
首先 ,基于 sigdemol. c 写 一 个 名 为 ouch. c 的 程序 。 也 就 是 第 6 章 中 的 OUCH 
EF. ouch c 将 从 命令 行 接受 两 个 参数 。 一 个 是 信号 处 理 函 数 要 打印 的 字符 
串 , 另 一 个 是 信和 号 处 理 函 数 在 打印 之 前 要 被 调用 的 次 数 。 比 如 命令 : 

S ouch hello 10& 
将 在 后 台 运 行程 序 ,程序 每 收 到 10 次 SIGINT 信号 打印 一 次 hello。 
然后 写 一 个 节拍 程序 ,并 命名 为 metronome. c。 这 个 程序 从 命令 行 接受 一 个 进程 
ID 列表 。 程 序 用 间隔 计时 器 来 生成 间隔 为 1 秒 的 SIGALRM 信和 号。 处 理 函 数 利 
用 kill 系统 调用 问 指 明 的 进程 发 送 SIGINT 信和 号。 比如 命令 

$ metronome 1 3456 7777 2345 
将 每 隔 1 秒 钟 向 ID 为 3456.7777 和 2345 的 进程 发 送 SIGINT 信号。 
在 后 台 启 动 3 ouch 实例 的 进程 。 给 每 个 进程 不 同 的 消息 字符 串 和 间 除 。 然 后 记 下 
它们 的 ID。 最 后 以 1 和 那些 进程 的 ID 作为 参数 来 启动 metronome 程序 。 


用 uslecp() 来 阻塞 程序 ,用 处 理 函 数 来 处 理 输入 在 bounceld. c 中 主 循环 在 
getch 被 阻塞 ,信号 处 理 函 数 来 控制 动画 。 基 于 hello5. c 的 机 制 重 写 bounceld. 
c。 在 新 的 版 本 中 用 户 输入 和 动画 的 角色 将 被 调换 ,也 就 是 说 主 循环 在 调用 
usleep 被 阻塞 ,程序 在 信和 号 处 理 范 数 中 处 理 用 户 输入 。 


写 一 个 测试 用 户 的 反应 速度 的 程序 序 等 待 一 个 随机 的 间隔 时 间 然 后 在 屏幕 
上 打印 一 个 一 位 十 进 制 数字 。 EE E A 程序 
记录 用 户 的 反应 速度 。 程 序 进行 10 次 这 样 的 测试 然后 报告 最 慢 、 最 快 和 平均 响 
应 时 间 。( 提 示 : 看 看 gettimeofday 的 用 户 手 册 ) 


完成 本 章 开始 描述 的 弹 球 游戏 。 添 加 分 数 .多 用 户 .缓冲 器 和 其 他 任何 能 想到 的 
使 游戏 变 得 好 玩 的 机 制 。 


9. 项目 
基于 本 章 学 习 的 知识 ,能 够 实现 以 下 的 几 个 Unix 程序 了 : 


snake, worms 











概念 与 技巧 

* Unix shell 的 功能 
* Unix 的 进程 模型 
。 如 何 执行 一 个 程序 
。 如 何 创建 一 个 进程 
© 父 进程 和 子 进程 之 间 如 何 通信 
相关 的 系统 调用 

e fork 

* exec 

e wait 

* exit 

相关 命令 

* sh 

。 ps 


8.1 进程 三 运行 中 的 程序 


Unix 是 如 何 运行 程序 的 ? 这 看 起 来 很 容易 : 首先 登录 ,然后 shell 打印 提示 符 , 输 入 命 
令 并 按 回 车 键 。 程 序 立 即 就 开始 运行 了 。 当 程序 结束 后 ,shell 打印 一 个 新 的 提示 符 。 但 这 
些 是 如 何 实现 的 呢 ? 什么 是 shell? shell 做 了 些 什 么 呢 ? 内 核 又 做 些 什么 ? 程序 是 什么 ? i 
行 一 个 程序 意味 着 什么 ? 

一 个 程序 是 存储 在 文件 中 的 机 器 指令 序列 。 一 般 它 是 由 编译 器 将 源 代 码 编译 成 二 进 制 
格式 的 代码 。 运 行 一 个 程序 意味 着 将 这 个 机 器 指令 序列 载 人 内 存 然后 让 处 理 器 (CPU) 逐 条 
执行 这 些 指 令 。 | 

在 Unix 术语 中 ,一 个 可 执行 程序 是 一 个 机 器 指令 及 其 数据 的 序列 。 一 个 进程 是 程序 运 
行 时 的 内 存 空间 和 设置 。 图 8. 1 显示 了 程序 和 进程 。 
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图 8.1 系统 中 的 进程 和 程序 


数据 和 程序 存储 在 磁盘 文件 中 ,程序 在 进程 中 运行 。 以 下 的 几 章 里 将 学 习 进 程 概 念 。 
从 命令 ps 和 sh 开始 ,然后 写 一 个 自己 的 Unix shell, 


8.2 通过 命令 ps 学 习 进 各 


进程 存在 于 用 户 空间 。 用 户 空间 是 存放 运行 的 程序 和 它们 的 数据 的 一 部 分 内 存 空间 。 
如 图 8. 2 所 示 , 可 以 通过 使 用 ps(process status 的 内 


容 。 这 个 命令 会 列 出 当前 的 进程 。 





用 户 空间 ps 
容纳 进程 
ps -a 
ps -l 
文件 系统 容纳 
文件 和 目录 
Is -a 
Is -l 
8.2 ps 命令 列 出 当前 进程 
$ ps 
PID TTY TIME CMD 
1775 pts/1 00:00:17 bash 
1981 pts/1 00:00:00 ps 


这 里 有 两 个 进程 在 运行 : bash(shell) A ps 命令 。 每 个 进程 都 有 一 个 可 以 惟一 标识 它 的 
数字 ,被 称 为 进程 ID。 一 般 简称 为 PID。 每 个 进程 都 与 一 个 终端 相连 ， 这 里 是 /dev/pts/1。 
每 个 进程 都 有 一 个 已 运行 的 时 间 。 注 意 ps 对 已 运行 时 间 统 计 并 不 是 非常 的 精确 ,从 ps 只 用 
T 0 秒 就 可 以 看 出 。 

ps 有 很 多 可 选项 。 和 ls 命令 一 样 ,ps 支持 -a 可 选项 : 
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$ Ps “a 

PID TIY TIME CMD 
1779 pts/0 00:00:13 gv 
1780 pts/0 00:00.07 gs 
1781 pts/O 00:00.01 vi 
2013 pts/2  00:00.23  xpaint 
2017 pts/2 00:00:02 mail 
2018 pts/1 00:00:00 ps 


-a 选项 列 出 所 有 进程 ,包括 在 其 他 终端 由 其 他 用 户 运 行 的 程序 。 但 是 带 选 项 -a 的 输 
出 并 不 包括 shell, ps 也 有 一 个 ~1 选项 来 打印 更 多 细节 : 


S ps - la 

F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD 
000 S 504 1779 1731 0 69 0 一 1086 do sel pts/0 00:00:13 gv 
000 S 504 1780 1779 0 69 0 一 2309 do sel  pts/0 00:00:07 gs 
000 S 504 1781 1731 0 72 0 一 1320 do sel pts/0 00:00:01 vi 
000 S 519 2013 1993 0 69 19 - 1300 do sel  pts/2 00:00:23 xpain 
000 S 519 2017 1993 0 69 0 一 363 read c pts/2 00:00:02 mail 
000 R 500 2023 1755 0 79 0 一 750 一 pts/1 00:00:00 ps 


名 为 S 的 一 列表 示 各 个 进程 的 状态 。S 列 的 值 为 R 说明 ps 对 应 的 进程 正在 运行 。 其 他 
进程 的 S 列 值 都 是 S, 说 明 它们 都 处 于 睡眠 状态 。 每 个 进程 都 属于 相应 的 由 UID 列 指明 的 
HF ID。 每 个 进程 都 有 一 个 进程 ID(PID) ,同时 也 有 一 个 父 进 程 IDCPPID), 

标记 为 PRI 和 NI 的 列 分 别 是 进程 的 优先 级 和 niceness 级 别 。 内 核 根 据 这 些 值 来 决定 
什么 时 候 运 行进 程 。 一 个 进程 可 以 增加 niceness 级 别 , 这 就 像 在 超市 里 在 排队 付 账 的 时 候 
让 其 他 客户 排 到 自己 的 前 面 。 超 级 用 户 可 以 减少 他 的 niceness 级 别 , 这 就 像 排 队 的 时 候 
插队 。 

一 个 进程 有 大 小 ,这 由 SZ 列表 示 。 这 列 的 数据 表示 这 个 进程 占用 的 内 存 大 小 。 在 例子 
中 mail 程序 比 xpaint 占用 少 得 多 的 内 存 。 因 为 后 者 耗费 大 量 的 内 存 来 存储 影像 。 程 序 在 运 
行 的 时 候 占 用 的 内 存 数量 可 能 会 动态 的 改变 。 如 果 程 序 在 运行 时 分 配 内 存 ,那么 它 占用 的 
内 存 就 会 增加 。 

WCHAN 列 显示 进程 睡眠 的 原因 。 上 面 的 例子 中 所 有 睡眠 的 进程 都 是 等 待 输入 。read 
_c 或 do_sel 代表 内 核 的 地 址 。ADDR 和 下 已 经 不 再 用 了 ,但 是 为 了 兼容 的 原因 而 保留 它们 。 
选项 -ly 将 只 显示 目前 使 用 的 值 。 

各 个 版 本 的 Unix 间 的 可 选 命令 参数 差别 很 大 。 前 面 提 到 的 -a 和 -1 可 选项 可 能 在 你 
的 系统 中 不 能 用 或 者 结果 不 同 。 查 阅 你 的 用 户 手册 。 上 面 的 例子 是 来 自 于 版 本 号 为 procps 
2.0.6。 例 子 只 给 出 了 ps 的 一 部 分 显示 功能 。 

ps 命令 是 很 强大 的 。 -fa 可 选项 产生 如 下 输出 ; 


S ps -fa 
UID PID PPID C STIME TTY TIME CMD 
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betsy 1779 1731 19:53 pts/0 00.00.01 gv dinner.ps 
betsy 1980 1779 19:53 bts/0 00:00:07 gs - dNOPLATFONTS 
betsy 1781 1731 19:54 pts/0 00:00:02 vi dinner 


yuriko 2013 1993 
yuriko 2017 1993 
bruce 2401 1755 


20:15 pts/2 00:00:00 xpaint 
20:16 pts/2 00:00:00 mail bruce 
20:36 pts/1 00.00.00 ps -af 


oco O O O 0 o 


-表示 格式 化 输出 ,这样 便 于 阅读 。 用 用 户 名 代替 UID 来 显示 。 在 CMD 列 显示 完整 
的 命令 行 。 


8.2.1 系统 进程 
除了 用 户 运行 的 进程 外 ,其 他 一 些 是 Unix 系统 用 来 完成 系统 任务 的 进程 ， 


$ ps - ax | head - 25 
PID TTY STAT TIME COMMAND 


1? 3 0:05 init 
27 SW 3:54. [kflushd] 
3? SW 0.38 | kupdate | 
4? SW 0:00 [ kpiod] 
579 SW 2:13 [ kswapd | 
35 ? SW 0:00 [ uhci - control | 
36 ? SW 0:00  [khubd] 
420 ? 0:25 syslogd 
423 9 S 0:36 klogd - k /boot/System.map- 2.2.14 
437 ? SW 0:00 [inetd] 
449 ? S 0:02 amd ~f /etc/am. d/conf 
461 7 SW 0:00 [ rpciod] 
466 ? 0:00 cron 
471 7 0:00 atd 
476 ? 0:00 sendmail; accepting connections on port 25 
484 ? SW 0:00 [ rpc. rstatd | 
500 ? S 0:46 sshd 
504 ? SW 0:00 [ calserver | 
506 ? SW 0.00 [keyserver | 
512 ? SW 0:00 [portsentry | 
514 ? SW 0:00 | portsentry | 
561 ttyl SW 0:00 [getty ] 
562 tty2 SW 0:00 | getty | 
563 tty3 SW 0:00 [getty | 


$ ps -as|wc - 1 
82 


上 面 的 例子 显示 了 当前 系统 中 运行 的 82 个 进程 中 的 前 24 个 。 其 中 部 分 是 系统 进程 。 
系统 进程 中 的 很 大 一 部 分 是 没有 终端 与 之 相连 的 。 它 们 在 系统 启动 时 启动 ,而 不 是 由 用 户 
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在 命令 行 输入 。 这 些 系 统 进程 做 些 什么 呢 ? 

列表 中 开始 的 几 个 分 别处 于 内 存 的 不 同 部 分 ,包括 内 核 缓 冲 和 虚 存 页 面 。 列 表 中 的 其 
他 一 些 管理 系统 日 志 (klogd,syslogd) ,调度 批 任务 (cron,atd) \ 防 范 可 能 的 攻击 (portsentry) 
和 让 一 般 的 用 户 登 录 (sshd,getty)。 可 以 通过 ps 一 ax 的 输出 和 Unix 手册 了 解 很 多 系统 的 
情况 。 运 行 ps 就 像 透 过 显微镜 看 一 滴 池 塘 水 。 能 看 到 很 多 各 式 各 样 的 进程 运行 在 系统 中 。 


8.2.2 进程 管理 和 文件 管理 


从 运行 ps 的 结果 看 出 进程 有 很 多 属性 。 每 个 进程 属于 某 个 用 户 ID、 有 一 定 的 大 小 、 一 
个 起 始 时 间 .已 运行 的 时 间 优先 级 和 niceness 级 别 。 有 些 进程 与 某 个 终端 相连 ,而 其 他 一 些 
则 没有 。 这 些 属 性 存放 在 什么 地 方 呢 ? 曾 对 文件 提 过 同样 的 问题 。 内 核 管理 内 存 中 的 进程 
和 磁盘 上 的 文件 。 这 些 管 理 活 动 有 什么 相似 之 处 吗 ? 

文件 包含 数据 ,进程 包含 可 执行 代码 。 文 件 有 一 些 属 性 ,进程 也 有 一 些 属 性 。 内 核 建立 
AR ,进程 类 似 。 就 像 管 理 磁 盘 的 多 个 文件 ,内 核 管理 内 存 中 的 多 个 进程 ,为 它们 分 
配 空间 ,并 记录 内 存 分 配 情况 。 内 存 管 理 和 磁盘 管理 有 什么 相似 之 处 ? 


8.2.3 内 存 和 程序 


进程 这 个 概念 有 些 抽 象 ,但 是 它 代 表 了 一 些 非 常 实际 的 实体 : 内 存 中 的 一 些 字 节 。 图 
8.3 演示 了 计算 机 内 存 的 3 种 模式 。 


内 存 可 以 看 作 是 一 个 容纳 内 核 
和 进程 的 空间 。 

很 多 系统 把 内 存 看 作 由 页 面 构 
成 的 数组 ,将 进程 分 割 到 不 同 
的 页 面 。 物 理 上 ,这 些 页 面 可 
能 被 存放 在 固体 的 芯片 中 。 





图 8.3 计算 机 内 存 的 3 种 模式 


Unix 系统 中 的 内 存 分 为 系统 空间 和 用 户 空间 。 进 程 存在 于 用 户 空 间 。 内 存 实际 上 就 是 
一 个 字 节 序列 ,或 者 一 个 很 大 的 数组 。 如 果 机 器 有 64 MB 的 内 存 ; 那 意味 着 这 个 数组 有 大 约 
6700 万 个 内 存 位 置 。 其 中 的 一 些 用 来 存放 组 成 内 核 的 机 器 指令 和 数据 。 

还 有 一 些 存 放 组 成 进程 的 机 器 指令 和 数据 。 一 个 进程 不 一 定 必须 要 占 一 段 连续 的 内 
存 。 就 像 文 件 在 磁盘 上 被 分 成 小 块 ,进程 在 内 存 也 被 分 成 小 块 。 同 样 和 文件 有 记录 分 配 了 
的 磁盘 块 的 列表 相似 ,进程 也 有 保存 分 配 到 的 内 存 页 面 (memory pages) 的 数据 结构 。 因此 ， 
将 进程 表示 为 用 户 空 间 内 的 一 个 小 方块 只 是 某 种 程度 的 抽象 。 

将 内 存 表示 为 连续 的 字 节 数组 也 是 一 种 抽象 。 现在 的 内 存 一 般 情况 下 是 由 小 电路 板 上 





一 一 一 一 
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的 一 些 芯片 组 成 。 

建立 一 个 进程 有 点 像 建立 一 个 磁盘 文件 。 内 核 要 找到 一 些 用 来 存放 程序 指令 和 数据 的 
空闲 内 存 页 。 内 核 还 要 建立 数据 结构 来 存放 相应 的 内 存 分 配 情 况 和 进程 属性 。 

使 操作 系统 变 得 神奇 的 不 仅 是 它 的 文件 系统 把 一 堆 旋 转 圆 盘 上 连续 的 艇 变 成 有 序 组 
织 的 树 状 目录 结构 ,而 且 以 相似 的 机 制 , 它 的 进程 系统 将 硅 片 上 的 一 些 位 组 织 成 一 个 进程 
社会 一 一 成 长 、 相 互 影响 .合作 、 出 生 、 工 作 和 和 死亡 。 这 有 点 像 蚂 蚁 农庄 。 

为 了 理解 进程 , 下面 将 学 习 和 实现 一 个 Unix shell, shell 是 一 个 管理 和 运行 程序 的 
程序 。 


8.3 shell: 进程 控制 和 程序 控制 的 一 个 工具 


| shell 是 一 个 管理 进程 和 运行 程序 的 程序 。 就 像 存 在 很 多 编程 语言 ,Unix 系统 有 很 多 种 
可 用 的 shell, 每 种 都 有 各 自 的 风格 和 优势 。 所 有 常用 的 shell 都 有 三 个 主要 功能 ， 
(1) 运行 程序 
(2) 管理 输入 和 输出 
(3) 可 编程 
看 看 下 面 的 命令 序列 : 


$ grep lp /etc/passwd 
lp:x:4:7:lp:/var/spool/lpd: 

$ TZ- PST8PDT;export TZ;date;TZ = EST5EDT 
Sat Jul 28 02:10:05 PDT 2001 

S date 

Sat Jul 28 05:10:14 EDT 2001 

$ ls -1 /etc > etc. listing 

S$ NAME = 1p 

$ if grep $ NAME /etc/passwd 


— then 

>> echo hello | mail $ NAME 
> fi 
lp:x:4:7:lp:/var/spool/ipd: 
$ 


(OD 运行 程序 

grep ,date ,ls echo 和 mail 都 是 一 些 普 通 的 程序 ,用 C 编写 ,并 被 编译 成 机 器 语言 。shell 
将 它们 载 人 内 存 并 运行 它们 。 很 多 人 把 shell 看 成 是 一 个 程序 启动 器 (program launcher). 

(2) 管理 输入 和 输出 

shell 不 仅仅 是 运行 程序 。 使 用 < > 和 | 符号 可 以 将 输入 .输出 重 定向 。 这 样 就 可 以 告 
诉 shell 将 进程 的 输入 和 输出 连接 到 一 个 文件 或 是 其 他 的 进程 。 

(3) 编程 
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shell 同时 也 是 带 有 变量 和 流程 控制 的 编程 语言 。 在 上 面 的 例子 中 ,可 以 看 到 使 用 了 两 
个 变量 。 首 先 , 变 量 TZ 被 设置 成 表示 美国 西海 岸 时 区 的 字符 串 。 然 后 这 个 值 被 作为 参数 传 
给 date 命令 来 打印 当前 的 日 期 和 时 间 。 

例子 的 后 面部 分 ,可 以 看 到 有 if.. then 语句 。 变 量 NAME SE EL ON FR “Ip”. 
$ NAME 的 值 在 grep 命令 中 被 使 用 。grep 的 结果 由 if 语句 进行 判断 。 如 果 在 文件 /ete/ 
passwd. 中 搜索 到 字符 串 “lp”, shell 就 执行 命令 echo hello| mail $ NAME, 否则 跳 至 下 一 条 
命令 。 

在 本 章 中 , 先 来 看 看 shell 是 如 何 运行 一 个 程序 的 。 在 后 面 的 章节 中 将 学 习 shell 的 脚本 
语言 和 输入 、 输 出 的 重 定 向 。 


8.4 shell 是 如 何 运 行程 序 的 


shell 打印 提示 符 , 输 入 命令 ,shell 就 运行 这 个 命令 ,然后 shell 再 次 打印 提示 符 一 一 如 此 
反复 。 那 么 这 些 现象 的 背后 到 底 发 生 些 什么 ? 

一 个 shell 的 主 循环 执行 下 面 的 4 步 ( 如 图 8. 4 所 示 )， 

(1) 用 户 键 人 a. out; 

(2) shell 建立 一 个 新 的 进程 来 运行 这 个 程序 ; 

(3) shell 将 程序 从 磁盘 载 入 ; 

(4) 程序 在 它 的 进程 中 运行 直到 结束 。 





图 8.4 用 户 要 求 shell 运行 一 个 程序 


8.4.1 shell 的 主 循环 
shell 由 下 面 的 循环 组 成 : 


while( ! end of input) 
get command 
execute command 


wait for command to finish 


考虑 下 面 这 个 与 shell 典型 的 互动 : 
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S ls 

Chap. bak Story08.tr chap08. ps chap08. tr outline. 08 
Makefile chap08 chap08. short code pix 

$ Ps 

PID TTY TIME CMD 

29182 pts/5 00.00.00 bash 

29183  pts/5 00:00:00 ps 

S 
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用 图 8.5 的 时 间 轴 来 表示 事件 发 生 次 序 。 其 中 时 间 从 左 向 右 消逝 。shell 由 标识 为 sh 


的 方块 代表 , 它 随 着 时 间 的 流逝 从 左 到 右 移动 。shell JE P RACE TES "Is", shell 建立 一 
个 新 的 进程 ,然后 在 那个 进程 中 运行 ls 程序 并 等 待 那个 进程 结束 。 
时 间 
us IIT" "n 
读 入 命令 读 人 命令 
等 待 退 出 等 待 退出 
ial 
| 新 进程 . | 新 进程 
| Li 
"PO us 
运行 命令 JR. inr iR 
"Is" | "ps" 
图 8.5 shell 主 循环 的 时 间 轴 
然后 shell 读 入 新 的 一 行 输 入 ,建立 一 个 新 进程 ,在 这 个 进程 中 运行 程序 并 等 待 这 个 进程 
结束 。 
34 shell 检测 到 输入 结束 , 它 就 退出 。 
为 了 要 写 一 个 shell, 需 要 学 会 
(1) 运行 一 个 程序 ; 
(2) 建立 一 个 进程 ; 
(3) SERE exit( ) 。 
当 学 会 这 些 , 就 能 用 这 些 技 术 来 实现 自己 的 shell 了 。 
8.4.2 问题 1: 一 个 程序 如 何 运 行 男 一 个 程序 
答案 : 程序 调用 execvp。 
图 8.6 显示 了 一 个 程序 如 何 运 行 另 一 个 程序 。 比 如 ,为 了 运行 ls -la,— 一 个 程序 调用 


execvp("Is",arglist), iX H arglist 是 命 
命令 参数 ls 和 -la 被 传 给 程序 ,然后 程序 开始 运行 。 简 而 言 之 


令 行 的 字符 串 数组 。 内 核 从 磁盘 将 程序 载 人 内 存 。 
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Unix 如 何 运行 一 个 程序 : 进程 


execvp (progname, arglist) 
字符 串 数 组 
1. 将 指定 的 程序 复制 到 调用 


它 的 进程 

2. 将 指定 的 字符 串 数 组 作为 
argv| ]f& fá ix 4 E 

3. 运行 这 个 程序 


图 8.6  execvp 将 程序 复制 到 内 存 后 运行 它 


(1) 程序 调用 execvp 

(2) 内 核 从 磁盘 将 程序 载 人 
(3) 内 核 将 arglist 复制 到 进程 
(4) 内 核 调 用 main(argc,argv) 
下 面 是 运行 ls -1 的 完整 程序 : 


/* execl.c — shows how easy it is for a program to run a program 


*/ 


main() 
( 
char * arglist[3]; 


arglist[0] = "ls"; 
arglist[1] = "-1", 
arglist[2] = 0; 
printf("**»* About to exec ls -1\n"); 
execvp( "ls" , arglist ); - 


printf(" xxx ls is done. bye\n"); 


execvp 有 两 个 参数 : 要 运行 的 程序 名 和 那个 程序 的 命令 行 参数 数组 。 当 程序 运行 时 命 
令 行 参 数 以 argv ] 传 给 程序 。 注 意 ,将 数组 的 第 一 个 元 素 置 为 程序 的 名 称 。 还 要 注意 ,最 后 
一 个 元 素 必 须 是 null。 

编译 并 运行 这 个 程序 : 

$ CC execl.c - o execl 


S ./execl.c 
*** About to exec ls - 1 
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total 28 

drwxr-x--- 2 bruce users 1024 Jul 14 21 .02 a 
drwxr-x---— 3 bruce users 1024 Jul 16 03:16 c 
-rw-r--r-- 1 bruce users 0 Jul 14 21:03 y 
s 


1. 第 二 条 打印 的 消息 哪里 去 了 ? 

再 看 一 下 代码 。 程 序 宣布 它 要 运行 ls 程序 ,运行 ls 程序 ,然后 宣布 ls 运行 结束 。 那 么 
第 二 条 信息 呢 ? | 

一 个 程序 在 一 个 进程 中 运行 一 一 也 就 是 一 些 内 存 和 内 核 中 相应 的 数据 结构 。 这 样 ， 
execvp 将 程序 从 磁盘 载 人 进程 以 便 它 可 以 被 运行 。 但 是 载 人 到 哪个 进程 呢 ? 这 就 是 问题 之 
所 在 : 内 核 将 新 程序 载 人 到 当前 进程 ,替代 当前 进程 的 代码 和 数据 。 

2. execvp 就 像 换 脑 

有 人 可 能 会 有 这 样 的 愿望 :“ 我 希望 能 用 爱 因 斯 坦 的 脑子 解决 这 个 问题 ,然后 再 用 自己 
的 脑子 做 其 他 的 事情 .” 一 种 实现 这 个 愿望 的 方法 是 拿 掉 你 的 大 脑 ,然后 装 上 爱 因 斯 坦 的 大 
脑 。 这 样 你 就 拥有 了 爱 因 斯 坦 的 思想 和 分 析 能 力 。 这 样 想 拥有 两 个 思维 的 愿望 就 和 原来 的 
大 脑 ? 一 起 被 拿 掉 了 ，。 / 

exec 系统 调用 ”从 当前 进程 中 把 当前 程序 的 机 器 指令 清除 ,然后 在 空 的 进程 中 载 人 调用 
时 指定 的 程序 代码 ,最 后 运行 这 个 新 的 程序 。exec 调整 进程 的 内 存 分 配 使 之 适应 新 的 程序 
对 内 存 的 要 求 。 相 同 的 进程 ,不 同 的 内 容 ，。 

execvp() 总 结 如 下 。 





execvp 
目标 在 指定 路 径 中 查找 并 执行 一 个 文件 
头 文 件 it include <unistd. h> 
函数 原型 result = execvp(const char x file,const char x argv[ ]) 
参数 | file 要 执行 的 文件 名 
argv 字符 串 数 组 
返回 值 一 1 如 果 出 错 





execvp 载 人 由 file 指定 的 程序 到 当前 进程 ,然后 试图 运行 它 。execvp 将 以 NULL 结尾 
的 字符 串 列 表 传 给 程序 。execvp 在 环境 变量 PATH 所 指定 的 路 径 中 查找 file 文件 。 

如 采 执 行 成 功 ,execvp 没有 返回 值 。 当 前 程序 从 进程 中 清除 ,新 的 程序 在 当前 进程 中 
运行 。 

3. 带 提 示 符 的 shell 

前 面 所 学 已 经 足够 写 第 一 个 版 本 的 shell 了 。 这 里 已 经 知道 如 何 运行 一 个 程序 ,还 知道 
如 何 将 命令 行 参数 传 给 它 。 第 一 个 shell 提示 用 户 输入 程序 名 和 参数 ,然后 运行 指定 的 程序 。 


D 和 所 有 水 有 大 脑 记忆 中 要 做 的 事情 。 
©  execvp 是 一 组 基于 execve 系统 调用 函数 中 的 一 个 .它们 统称 为 exec。 


——— — 
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将 程序 命名 为 pshl. c, 它 是 之 提示 符 的 shell(prompting shell) 的 缩写 : 


/* prompting shell version 1 
x Prompts for the command and its arguments. 
x Builds the argument vector for the call to execvp. 


x Uses execvp(), and never returns. 


x/ 


H include <stdio.h> 
# include <csignal.h> 
# include «string. h> 


+ define MAXARGS 20 /x cmdline argsx/ 
+ define ARGLEN 100 /* token lengthx/ 


int main() 


{ 


char x arglist[MAXARGS + 1]; /* an array of ptrsx/ 
int numargs; /* index into arrayx/ 
char argbuf| ARGLEN | ; /* read stuff herex/ 
char * makestring() ; /* malloc etc x/ 


numargs = 0; 
while ( numargs < MAXARGS ) 


printf("Arg[ & d]? ", numargs) ; 
if ( fgets(argbuf, ARGLEN, stdin) && x argbuf 1= '\n' ) 
arglist|numargs ++ ] = makestring(argbuf); 
else 
1 
if ( numargs > 0 ){ /* any args? x/ 
arglist[numargs | = NULL; /* close list x/ 
execute( arglist ); /* do it x/ 
numargs - 0; /* and reset «/ 
j 
j 
} 
return 0; 


j 


int execute( char x arglist[]) 
/* 
* use execvp to do it 
*/ 
{ 
execvp(arglist[0], arglist) ; /* do it x/ 


perror("execvp failed"); 
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exit(1) ; 
j 


char * makestring( char x buf ) 

/* 

* trim off newline and create storage for the string 
x / | 

1 


char *cp, * malloc(); 


buf[strlen(buf)-1] = '\0'; /* trim newline x/ 
cp = malloc( strlen(buf) +1 ); /x get memory x/ . 
if (cp == NULL ){ f /* or die */ 
fprintf(stderr, "no memory\n") ; 
exit (1); 
} 
strcpy(cp, buf); l /* copy chars */ 
return cp; /* return ptr x/ 


} 


pshl. c 是 Unix shell 的 第 一 个 草案 。pshl 要 求 每 个 字符 串 单 独 的 输入 ,第 一 个 是 程序 

. 名 ,然后 依次 是 程序 参数 。 代 码 包 括 两 步 : (1) 一 个 字符 串 一 个 字符 串 的 构造 参数 列表 

arglist, 最 后 在 数组 末尾 加 上 NULL; (2) 将 arglist[0] 和 arglist 数组 传 给 execvp ,如 图 8. 7 
所 示 。 | 





Is -l demodir — wN? 


arglist 






3 execvp (prog, arglist); 


4 


图 8.7 用 数组 构造 arglist 









1. 将 命令 行 读 和 缓冲。 
2. 将 缓冲 分 割 为 参数 列表 。 
3. 将 参数 列表 传 给 cxccvp。 





编译 并 运行 程序 : 


$ cc pshl.c -o pshi 
S ./pshl 
Arg| 0]? 1s 


Arg[1]? - 1 
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Arg[ 2]? demodir 
Arg[ 3]? 
total 2 


drwxr-x--- 2 bruce users 1024 Jul 14 21:02 a 
drwxr-x--- 3 bruce users 1024 Jul 16 03:16 c 
-rW-r--r-- 1 bruce users 0 Jul 14 21:03 y 


$ 


4. 它 怎么 退出 了 ? 

程序 运行 正常 ,但 是 就 像 设 想 的 那样 ,execvp 用 命令 指定 的 程序 代码 覆盖 了 shell HE 
序 代 码 , 然 后 在 命令 指定 的 程序 结束 之 后 退出 。 这 样 shell 就 不 能 再 次 接受 新 的 命令 。 为 了 
运行 新 的 命令 ,用 户 不 得 不 再 次 运行 shell。 

shell 如 何 能 做 到 在 运行 程序 的 同时 还 能 等 待 下 一 个 命令 呢 ? 方法 之 一 就 是 启动 一 个 新 
的 进程 ,由 这 个 进程 来 执行 命令 程序 。 


8.4.3 问题 2: 如 何 建立 新 的 进程 


答案 : 一 个 进程 调用 fork 来 复制 自己 。 

用法: forkO; /*takes no arguments*/ 

l. 解释 fork | 

继续 用 爱 因 斯 坦 大 脑 思考 的 问题 做 比喻 。 就 像 先 前 看 到 的 ,将 爱 因 斯 坦 的 大 脑 放 到 你 
的 脑壳 里 不 但 把 爱 因 斯 坦 的 思想 给 了 你 ,同时 也 清除 了 所 有 你 原来 大 脑 里 的 思想 。 

解决 的 方法 之 一 就 是 复制 一 个 自己 ,采用 三 位 影像 复制 技术 ,逐个 原子 的 复制 一 个 完全 
等 价 的 自己 。 当 你 建立 了 自己 的 复制 品 ,将 爱 因 斯 坦 的 大 脑 放 到 它 的 脑壳 里 ,这 样 你 就 可 以 
继续 你 原来 的 计划 和 思考 了 。 在 你 生命 中 的 某 个 阶段 ,世界 上 只 有 一 个 你 。 当 你 按 下 复制 
机 的 复制 按钮 ,世界 上 有 了 两 个 你 。 对 自己 的 复制 有 点 像 马路 上 的 岔口。 开始 只 有 一 条 路 ， 
然后 有 了 两 条 。 

fork 之 前 fork 之 后 





新 的 进程 拥有 和 公 父 进 程 相同 的 
代码 和 数据 


图 8.8 fork() 复 制 一 个 进程 
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这 就 是 系统 调用 fork 做 的 事情 。 图 8.8 显示 了 fork 调用 前 后 的 系统 状况 。 进 程 拥有 程 
序 和 当前 运行 到 的 位 置 。 进 程 调用 fork, 当 控制 转移 到 内 核 中 的 fork 代码 后 ,内核 做 : 

OD 分 配 新 的 内 存 块 和 内 核 数 据 结构 

《2) 复制 原来 的 进程 到 新 的 进程 

(3) 向 运行 进程 集 添加 新 的 进程 

(4) 将 控制 返回 给 两 个 进程 

当 你 按 下 复制 机 的 开始 按钮 后 ,世界 上 将 有 两 个 你 ,物理 上 、 心 理 上 都 是 相同 的 。 但 是 
每 个 人 将 开始 你 (他 ) 自 己 的 人 生 之 路 。 类 似 地 , 当 一 个 进程 调用 fork 之 后 ,就 有 两 个 二 进 制 
代码 相同 的 进程 。 而 且 它 们 都 运行 到 相同 的 地 方 。 但 是 每 个 进程 都 将 可 以 开始 它们 自己 的 
旅程 。 看 如 下 程序 。 

2. 例子 ; forkdemol. c 一 一 建立 一 个 新 的 进程 

forkdemol. c 有 两 句 打 印 语 人 句 , 一 句 在 fork 之 前 ,一句 在 fork 之 后 





/* forkdemol.c 
* shows how fork creates two processes, distinguishable 


* by the different return values from fork() 


x/ 
# include <stdio.h> 


main() 

( 

|. int ret from fork, mypid; 
mypid = getpid(); /x who am i? x/ 
printf("Before: my pid is % d\n", mypid); /* tell the world */ 


ret from fork - fork(); 


sleep(1); 
printf ("After; my pid is %d, fork() said * d\n", 
| getpid(), ret from fork); 
j 


如 果 这 是 一 个 普通 的 程序 ,将 看 到 两 行 输出 ,每 行 打印 一 一 个 状态 ， 但 是 当 它 运行 时 将 
看 到 : 


$ cc forkdemol.c - o forkdemol 

$ ./forkdemol 

Before ;my pid is 4170 

After :my pid is 4170, fork() said 4171 
$ After, my pid is 4171,fork() said 0 


这 里 可 以 看 到 三 行 输出 ,一 一 行 Before: 信息 和 两 行 After: 人 信息。 进程 4170 先是 打印 | 
Before: 消息 ,然后 它 又 打印 After, 消息 一 一 一 切 正常 。 另 一 个 After. 信息 是 由 进程 4171 
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打印 的 。 注 意 进程 4171 没 有 打印 Before: 信息 。 为 什么 呢 ? 用 户 空 间 的 近 照 (如 图 8. 9 所 
不 ) 显 示 了 进程 4170 调用 fork 前 后 发 生 了 什么 。 


fork 之 前 fork 之 后 





一 个 控制 流 进入 内 核 的 fork 模块 调用 完成 时 ， 从 fork 返回 两 个 控制 流 
图 8.9 子 进 程 执行 fork() 之 后 的 代码 


内 核 通过 复制 进程 4170 来 创建 进程 4171, 它 将 4170 的 代码 和 当前 运行 到 的 位 置 都 复 
制 给 4171。 其 中 当前 运行 的 位 置 是 由 随 着 代码 向 下 移动 的 箭头 表示 的 。 新 的 进程 4171 从 
fork 返回 的 地 方 开 始 运行 ,而 不 是 从 开头 开始 运行 。 因 为 4171 是 从 中 间 开 始 运行 的 ,也 就 不 
打印 Before: 信息 了 。 

3. 例子 : forkdemo2. c 子 进 程 创 建 进程 

子 进程 不 是 从 main 函数 的 开始 ,而 是 从 fork 返回 的 地 方 开始 它 的 生命 之 旅 。 预 测 一 下 
下 面 程 序 会 有 几 行 输出 : 





/* forkdemo2.c - shows how child processes pick up at the return 


x from fork() and can execute any code they like, 
x even fork(). Predict number of lines of output. 
x/ 

main() 


( 
printf("my pid is % d\n", getpid() ); 
fork; 
fork(); 
fork(); 
printf("my pid is % d\n", getpid() ); 
} 


编译 并 运行 这 个 程序 ,结果 如 何 ? 

4. 例子 : forkdemo3. c Sy PER SEHE Fo -F BE FZ 

从 forkdemol. direi 4170 调用 fork 创立 子 进程 , 子 进程 PID Æ 4171. PHAGE 
程 有 相同 的 代码 ,运行 到 同一 行 有 相同 的 数据 和 进程 属性 。 那 么 如 何 才 能 分 辨 到 底 是 父 进 
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程 还 是 子 进 程 呢 ? 
这 两 个 进程 不 是 完全 相同 的 。 从 forkdemol. c 的 输出 可 以 看 出 ,不 同 的 进程 ,fork 的 返 


_ 回 值 是 不 同 的 。 在 子 进程 中 fork 返回 0, 在 父 进程 中 fork 返回 4171。 根 据 fork 的 返回 值 进 
程 可 以 很 容易 的 判断 自己 是 子 进程 还 是 父 进程 。 
在 下 一 个 例子 forkdemo3. c 中 ,进程 根据 fork 返回 值 的 不 同 打印 不 同 的 消息 : 


/* forkdemo3.c - shows how the return value from fork() 


x allows a process to determine whether 
x it is a child or process 
x/ 


it include <(stdio. h> 


main() 


( 


int fork rv; 
printf("Before: my pid is % d\n", getpid()); 
fork.rv = fork(); /* create new process */ 


if ( fork rv == —1]) /* check for error x/ 


perror("fork"), | 


else if ( fork rv == 0) 
printf("I am the child. my pid= % d\n", getpid()); 
else 


printf("I am the parent. my child is %d\n", fork rv); 
| 


下 面 是 运行 结果 : 


S ./forkdemo3 | | ` 
Before: my pid is 5931 

I am the parent. my child is 5932 

I am the child. my pid = 5932 

3 


fork 小 结 如 下 。 
系统 调用 fork 正 是 解决 shell 只 能 运行 一 条 命令 这 个 问题 所 需要 的 。 使 用 fork ,不 但 能 
够 创建 新 的 进程 ,而 且 能 够 分 辨 原来 的 进程 和 新 创建 的 进程 。 新 的 进程 能 调用 execvp 来 执 


行 任 何 用 户 指明 的 程序 。 
这 里 明确 建立 一 个 shell 所 需 三 项 技术 中 的 两 项 。 知道 了 如 何 建立 进程 (fork) 和 如 何 运 


行 一 个 程序 (execvp)。 最 后 需要 知道 如 何 让 父 进程 等 待 子 进程 结束 。 
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fork 

目标 创建 进程 
头 文件 # include«cunistd. h> 
ER or Ja E pid_t result = fork( void) 
参数 ”没有 
返回 值 一 ] 如 果 错 误 

0 返回 到 子 进程 

pid 将 子 进 程 的 进程 ID 传 给 父 进程 


8.4.4 问题 3: 父 进程 如 何等 待 子 进程 的 退出 


答案 : 进程 调用 wait 等 待 子 进程 结束 。 

用 法 : pid = wait(& status); 

1. 解释 wait 

系统 调用 wait 做 两 件 事 。 首 先 , wait 暂停 调用 它 的 进程 直到 子 进程 结束 。 然 后 ,wait 取 
得 子 进 程 结 束 时 传 给 exit 的 值 。 | 

图 8. 10 显示 了 wait 是 如 何 工作 的 。 注 意 时 间 轴 是 自 左 向 右 的 , 父 进程 在 左边 开始 调用 
fork。 内 核 构 造 子 进程 ,这 里 子 进程 由 另外 一 个 小 方块 代表 。 子 进程 开始 和 父 进程 并 行 运 
行 , 父 进程 调用 wait, 内核 挂 起 父 进 程 直到 子 进程 结束 。 父 进程 标识 为 wait 的 一 段 暂停 


运行 。 
fork ( ) | wait ( ) 


图 8.10 wait 暂停 父 进程 直到 子 进 程 结 束 


最 终 子 进程 会 结束 任务 并 调用 exit(n) 。n 是 0 到 255 的 一 个 数字 。 

当 子 进程 调用 exit ,内核 唤醒 父 进 程 同时 将 子 进程 传 给 exit 的 参数 。 唤 醒 和 传递 退出 
(exit) 值 的 动作 由 从 exit 的 括号 到 父 进 程 的 箭头 表示 。 这 样 wait 执行 两 个 操作 : 通知 和 
通信 。 

2. 例子 ，waitdemol. c 通知 

waitdemol. c 显示 了 子 进程 调用 exit 是 如 何 触 发 wait 返回 父 进程 的 。 





/* waitdemol.c — shows how parent pauses until child finishes 


*/ 
# include <stdio. h> 


#define DELAY 2 
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main() 


{ 
int newpid; 


void child code(), parent _code(); 
printf( "before; mypid is & d\n", getpid()); 


if ( (Ünewpid = fork()) == -1) 
perror( "fork"); 
else if ( newpid == 0) 
child_code(DELAY) ; 
else | 
parent code(newpid); 
} 
/* 
* new process takes a nap and then exits 
*/ 
void child code(int delay) 
( 
printf("child % d here. will sleep for % d seconds\n", getpid(), delay); 
sleep(delay); 
printf("child done. about to exit\n"); 
exit(17); 
j 
/* 
* parent waits for child then prints a message 
*/ 
void parent code( int childpid) 
{ 
int wait_rv; _/* return value from wait() */ 
wait rv = wait(NULL); 
printf("done waiting for %d. Wait returned : $dWn", childpid, wait rv); 


运行 waitdemol. c 的 结果 如 下 : 


S ./waitdemol 

before: mypid is 10328 

child 10329 here.will sleep for 2 seconds 
child done. about to exit 

do waiting for 10329. Wait returned.10329 


运行 程序 .调整 时 间 , 可 以 发 现 父 进程 总 会 等 到 子 进 程 调用 exit, BH 8.11 演示 了 控制 流 
和 两 个 进程 之 间 的 数据 传输 。 在 父 进程 ,控制 流 始 于 程序 的 开始 ,在 wait 的 地 方 阻 塞 。 在 子 
进程 ,控制 流 始 于 main 函数 的 中 部 ,然后 运行 child. code 函数 ,最 后 调用 exit 结束 。 子 进程 
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调用 exit 就 像 发 送 一 个 信号 给 父 进程 以 唤醒 它 。 


parent child 


父 进 程 在 wait 处 阻塞 ， 
然后 在 子 进程 退出 后 继 
续 运 行 。 TEMA 
exit (n); 


Pour. dodo ( ) 


| int status; SS | int status; 


Y waittestatle), = HO og sro) poo 





图 8.11 调用 wait() 前 后 的 控制 流 和 进程 间 通 信 


waitdemol. c 程序 体现 了 wait 的 两 个 重要 特征 ; 

(1) wait 阻塞 调用 它 的 程序 直到 子 进程 结束 

在 这 个 简单 的 程序 中 , 父 进程 阻塞 直到 子 进程 调用 exit. 这 一 特征 使 两 个 进程 能 够 同步 
它们 的 行为 。 比 如 , 父 进程 用 fork 创建 一 个 子 进程 来 对 一 一 个 文件 排序 。 父 进程 必须 等 排序 
.结束 后 才能 继续 处 理 这 个 文件 。 系 统 调用 exit 和 wait 是 一 种 协调 这 些 任务 的 方法 。 

(2) wait 返回 结束 进程 的 PID 

在 这 个 简单 的 程序 中 ,wait 的 返回 值 是 调用 exit 的 子 进程 的 PID., 就 像 在 forkdemo2. c 
中 看 到 的 ,一 个 进程 可 以 创建 多 个 子 进程 。 考虑 一 个 从 两 个 不 同 的 远程 数据 库 整合 数据 的 “ 
程序 。 这 个 程序 可 以 使 用 fork 来 创建 两 个 进程 ,一 个 用 来 连接 并 从 数据 库 中 提取 数据 , 另 一 
个 从 其 他 数据 库 提取 数据 。 从 第 一 个 数据 库 提取 来 的 数据 需要 做 些 后 期 处 理 , 而 从 第 二 
数据 库 提取 来 的 数据 则 不 需要 这 样 的 处 理 。 J 

wait 的 返回 值 告 诉 父 进程 那个 任务 结束 了 。 这 样 它 就 可 以 继续 有 效 的 处 理 了 。 

3. 例子 : waitdemo2. c 通信 

wait 的 目的 之 一 是 通知 父 进 程 子 进 程 结束 运行 了 。 它 ERS 个 目的 是 告诉 父 进程 子 进 
程 是 如 何 结 束 的 。 

一 个 进程 以 3 种 方式 (成 功 、 失败 或 死亡 ) 之 结束 其 一 ,一 个 进程 可 能 顺利 完成 它 的 

任务 。 按照 Unix 惯例 ,成 功 的 程序 调用 exit(0) 或 者 从 main 函数 中 return 0, 

其 二 ,进程 可 能 失败 。 比如 进程 可 能 由 于 内 存 耗 尽 而 提前 退出 程序 。 按 Unix 惯例 , 程 
序 遇 到 问题 而 要 退出 调用 exit 时 传 给 它 一 个 非 零 的 值 。 BUE ei ged 
的 值 ,手册 中 有 详细 的 描述 。 
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最 后 ,程序 可 能 被 一 个 信号 杀 死 ( 见 第 6 和 第 7 章 )。 信 号 可 能 来 自 键盘 .间隔 计时 器 .内 
核 或 者 其 他 进程 。 通 常 的 情况 下 ,一 个 既 没 有 被 忽略 又 没有 被 捕获 信号 会 杀 死 进程 的 ， 

wait 返回 结束 的 子 进程 的 PID 给 父 进程 。 父 进程 如 何 知道 子 进 程 是 以 何 种 方式 退出 
的 呢 ? 

答案 在 传 给 wait 的 参数 之 中 。 父 进程 调用 wait 时 传 一 个 整 型 变量 地 址 给 函数 。 内 核 
将 子 进程 的 退出 状态 保存 在 这 个 变量 中 。 如 果子 进程 调用 exit 退出 ,那么 内 核 把 exit 的 返 
回 值 存放 到 这 个 整数 变量 中 ; 如 果 进 程 是 被 杀 死 的 ,那么 内 核 将 信号 序号 存放 在 这 个 变量 
中 。 这 个 整数 由 3 部 分 组 成 一 一 8 个 bit 是 记录 退出 值 ,7 个 bit 是 记录 信号 序号 ; 另 一 个 bit 
用 来 指明 发 生 错误 并 产生 了 内 核 映 像 (core dump)。 图 8. 12 演示 了 子 进程 状态 值 的 3 个 
部 分 。 





exit value > signal number 


child 





图 8.12 子 进程 状态 值 有 3 部 分 


例子 waitdemo2. c 是 基于 waitdemol. c 的 , 它 显示 了 子 进程 的 退出 状态 . 


/* waitdemo2.c - shows how parent gets child status 


x/ 
# include <stdio.h> 
# define DELAY 5 


main() 
{ 
int newpid; 
void child_code(), parent_code() ; 


printf("before: mypid is % d\n", getpid()); 


if ( (newpid = fork()) == -1) 
perror("fork") ; 

else if ( newpid == 0 ) 
child_code( DELAY) ; 


else 
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parent code(newpid); 
j 
/* 
* new process takes a nap and then exits 
x/ 
void child code(int delay) 
{ 
printf("child % d here. wil] sleep for % d seconds\n", getpid(), delay); 
sleep(delay) ; | 
printf("child done. about to exit\n"); 
exit(17); 
} 
/* 
x parent waits for child then prints a message 
x/ 
void parent code(int childpid) 
1 
int wait rv; /* return value from wait() x/ 
int child status; | 
int high 8, low 7, bit 7; 


wait rv = wait(&child status); 


printf("done waiting for *d. Wait returned: % d\n", childpid, wait rv); 


high 8 = child status >> 8; /x 1111 1111 0000 0000 x/ 
low 7 = child status & Ox7F; /* 0000 0000 0111 1111 x/ 
bit 7 - child status & 0x80; /* 0000 0000 1000 0000 «/ 


printf( "status; exit- $d, sig= *&d, core= % d\n", high 8, low 7, bit 7); 


首先 ,让 waitdemo2 正常 退出 。 退 出 状态 从 子 进程 处 复制 ; 


$ ./waitdemo2 

before: mypid is 10855 

child 10856 here. will sleep for 5 seconds 
child done. about to exit 

done waiting for 10856 . Wait returned: 10856 


status; exit = 17, sig=0, core=0 


然后 ,在 后 台 运 行 waitdemo2 ,使 用 kill( 见 第 7 章 ) 来 向 子 进程 发 送 SIGTERM 信和 号、 


$ ./waitdemo2 & 

.$ before: mypid is 10857 

child 10858 here. will sleep for 5 seconds 
kill 10858 
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$ done waiting for 10858. Wait returned: 10858 


status; exit 7 0, sig= 15, core- 0 ` 








wait() 小 结 如 下 。 
| wait 
目标 等 待 进程 结束 
头 文件 # include « sys/types. h> 
| i include «sys/ wait. h> 
落 数 原型 pid t result = wait(int * statusptr) 
参数 statusptr 子 进 程 的 运行 结果 
返回 值 一 ] 过 到 错误 
pid 结束 进程 的 进程 id 
相关 内 容 waitpid(2) , wait3(2) 


wait 系统 函数 挂 起 调用 它 的 进程 直到 得 到 这 个 进程 的 子 进程 的 一 个 结束 状态 。 结 束 状 
态 是 退出 值 或 者 是 信号 序号 。 如 果 有 一 个 子 进程 已 经 退出 或 被 杀 死 ,对 wait 的 调用 立即 返 
回 。wait 返回 结束 进程 的 PID。 如 果 statusptr 不 是 NULL, wait 将 退出 状态 或 者 信号 序号 
复制 到 statusptr 指向 的 整数 中 。 这 个 值 可 以 用 二 sys/wait.h 二 中 的 宏 来 检测 。 

如 果 调 用 的 进程 没有 子 进程 也 没有 得 到 终止 状态 值 , 则 wait 返回 一 1， 


8.4.5 小 结 : shell 如 何 运行 程序 


这 一 节 以 问题 “shell 是 如 何 运行 程序 的 ?开始 ,现在 已 经 知道 答案 了 : shell 用 fork 建 
立新 进程 ,用 exec 在 新 进程 中 运行 用 户 指 定 的 程序 ,最 后 shell 用 wait 等 待 新 进程 结束 。 
wait 系统 调用 同时 从 内 核 取 得 退出 状态 或 者 信号 序号 以 告知 子 进程 是 如 何 结束 的 。 | 

每 个 Unix shell 都 是 使 用 图 8. 13 所 示 的 模型 。 现 在 将 这 3 个 系统 调用 组 合 在 一 起 实现 
一 个 真正 的 shell, 


!. 打印 提 。 2. 取得 命令 ”3. 建立 新 ”4. 等 待 子 进程 5. 得 到 子 进程 状态 


示 符 进程 
bre pnr e m m] nnn 


4. 运行 新 5. 新 程序 6 新 程序 结束 
程序 在 运行 





图 8. 13 shell 的 forkO exec() 和 waitO 循环 
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8.5 实现 一 个 shell psh2.c 


图 8. 14 是 一 个 Unix shell 的 简化 流程 图 。 下 一 个 shell psh2. c 将 使 用 这 个 流程 。 


—» get command 


— 

| 

| 三 一 fork 一 一 E 

| wait UL 
| | 

| i | exit 


图 8.14 Unix shell 的 基本 逻辑 . . . 


/* * prompting shell version 2 
x x 
x * Solves the 'one- shot' problem of version 1 NL 
x * Uses execvp(), but fork()s first so that the 
x * shell waits around to perform another command 
** New problem; shell catches signals. Run vi, press ^c. 


*x*/ 


# include <stdio. h> 
# include < signal. h> 


+ define MAXARGS 20 /* cmdline args */ 


# define ARGLEN 100 /* token length x/ 

main() 

{ 
char x» arglist| MAXARGS t 1]; /x an array of ptrs x/ 
int numargs; /* index into array x/ 
char  argbuf[ARGLEN]; /* read stuff here x/ 
char x makestring() : /* malloc etc x/ 


numargs = O0; 
while ( numargs << MAXARGS ) 
{ 
printf("Arg| *d]? ", numargs) ; 
if ( fgets(argbuf, ARGLEN, stdin) && x argbuf 1= '\n' ) 
arglist[numargs t* | = makestring(argbuf); 
else 


{ 
if ( numargs — 0 ){ /* any args? x/ 





` 
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arglist[numargs]- NULL; /x close list x/ 
execute( arglist ); /* do it x/ 
numargs = 0; /* and reset x/ 


j 


j 


return 0; 


} 


execute( char x arglist[ |) 


/* 
* use fork and execvp and wait to do it 
x/ 
{ 
int pid,exitstatus; /* of child x/ 
pid = fork(); /* make new process x/ 


switch( pid )| 

case >1: 
perror( "fork failed"); 
exit(1): 

case 0; 
execvp(arglist[0], arglist); /x do it «/ 
perror("execvp failed"); 
exit(1); 

default: 
while( wait(&exitstatus) != pid) 
printf ("child exited with status %d, % d\n", 

exitstatus>>8, exitstatus&0377) ; 


j 

char x makestring( char x buf ) 

/* 
* trim off newline and create storage for the string 
*/ 

{ 


char * cp, xmallocO; 


buf[strlen(buf)- 1] = '\0'; /* trim newline x/ 
cp = malloc( strlen(buf) +1 ); /* get memory */ 
if (cp == NULL ){ /x or die */ 


fprintf(stderr, "no memory\n") ; 
exit(1); 


* 291 
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strcpy(cp, buf); /x copy chars x/ 


return Cp; /* return ptr */ 


测试 一 下 psh2 ,看 看 它 是 否 解决 了 只 能 运行 一 条 命令 这 个 问题 ， 


$ ./psh2 

Arg[0]? 1s 

Arg|i]? -1 

Arg| 2]? demodir 

Arg[ 3 |? 

total 2 

drwxr 一 和 一 一 一 2 bruce users 1024 Jul 14 21:02a 
drwxr- x-—---— 3 bruce users 1024 Jul 16 03:16c 
-rw-r--r-- 1 bruce users 0 Jul 14 21:03 y 
child exited with status 0,0 

Arg|0]? ps 

Arg [1]? 

PID TTY TIME CMD 

11616 pts/4 00:00:00 bash 
. 11648 pts/4 00-00-00 psh2 

11664 pts/4 00:00:00 ps 

child exited with status 0,0 

Arg|0]? pshl fe! 能 运行 pshl T 


Arg| 1 ]? 

Arg|0]? ps 这 是 pshl 的 提示 符 ! 
Arg[ 1 ]? 

PID TTY TIME CMD 
11616 pts/4 00:00:00 bash 
11648 pts/4 00:00:00 psh2 
11683 pts/4 00:00:00 ps 


child exited with status 0,0 
Arg[ 0]? grep 

Arg|1]? fred 

Arg|2]? /etc/passwd 

Arg| 3]? 

child exited with status 1,0 
Arg|O |? fE^D 

Arg[0]? Arg[O ]? Arg[ 0]? exit 
Arg] 1 ]? 

execvp failed: No such file or directory 
child exited with status 1,0 
Arg[0]? $E^C 

$ 
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如 何 做 到 ? 

psh2.c 工 作 正 常 。 新 的 shell 接受 程序 名 称 、 参 数列 表 、 运 行程 序 、 报 告 结果 ,然后 再 重 
新 接受 和 运行 其 他 程序 。psh2. c 缺少 常用 的 shell 的 一 些 修饰 性 功能 ,但 可 以 作为 一 个 坚实 
的 基础 开始 了 。 

下 一 个 版 本 中 将 做 如 下 改进 : 

(1) 让 用 户 可 以 通过 按 下 Ctrl-D 或 者 输入 “exit” 退 出 程序 ; 

(2) 让 用 户 能 够 在 一 行 中 输入 所 有 参数 。 

在 下 一 章 实现 的 版 本 中 加 上 这 些 功 能 。 在 那个 版 本 中 ,将 加 上 一 一 竺 变量 和 控制 流程 使 
它 更 像 一 个 编程 语言 。 

这 之 前 必须 更 正 一 一 个 严重 的 错误 ， 


信号 和 psh2. c 


从 测试 中 可 以 看 到 ,退出 程序 psh2 的 惟一 方法 是 按 Ctrl-C 键 。 如 果 在 psh2 等 待 子 进 
程 结束 时 键入 Ctrl-C 键 会 如 何 呢 ?比如 . 


$ ./psh2 
Arg[|0]? tr 
Arg[1]? [a-z] 
Arg[ 2]? [A- Z] 
Arg| 3 ]? 

hello 

HELLO 

now to press 
NOW TO PRESS 
Ctrl -C 按 下 ^C 
$ 


于 进程 结束 ,但 是 shell 也 结束 了 。 按 下 Ctrl-C 所 生成 的 SIGINT 信号 不 但 杀 死 了 运 
fr tr 的 进程 ,而 且 杀 死 了 运行 psh2 的 进程 。 为 什么 呢 ? 

键盘 信号 发 给 所 有 连接 的 进程 

程序 psh2 和 tr 都 连接 到 终端 (如 图 8. 15 所 示 )。 当 按 下 中 断 键 ,ttz 驱动 告诉 内 核 向 所 





图 8.15 键盘 信号 发 向 所 有 连接 的 进程 
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有 由 这 个 终端 控制 的 进程 发 送 SIGINT 信号 。tr 死 了 ,在 我 们 的 程序 里 , psh 也 死 掉 了 ,即使 


它 还 在 等 待 子 进程 的 结束 。 
如 何 才 能 让 shell 不 被 用 户 按 下 的 中 断 或 退出 键 杀 死 ? 这 个 改动 留 作 习题 。 


8.6 思考 : 用 进程 编程 


为 了 理解 Unix 进程 ,运行 了 ps 命令 ,还 学 习 了 shell 如 何 使 用 fork、exit 和 wait 来 控制 
进程 和 运行 程序 。 

在 继续 学 习 下 一 章 有 关 在 shell 中 增加 变量 和 循环 之 前 ,考虑 一 下 函数 和 进程 之 间 的 相 
似 性 。 

l. execvp/exit 就 像 call/return 

(1) call/ return 

一 个 C 程序 由 很 多 函数 组 成 。 一 个 函数 可 以 调用 另 一 个 函数 ,同时 传 给 它 一 些 参数 。 

被 调用 的 函数 执行 一 定 的 操作 ,然后 返回 一 个 值 。 每 个 函数 都 有 它 的 局 部 变量 ， 不 同 的 函数 
通过 call/return 系统 进行 通信 。 

这 种 通过 参数 和 返回 值 在 拥有 私有 数据 的 函数 间 通 信 的 模式 是 结构 化 程序 设计 的 基 
础 。Unix 鼓励 将 这 种 应 用 于 程序 之 内 的 模式 扩展 到 程序 之 间 。 这 种 模式 可 以 用 图 8. 16 来 
表示 。 


fork exec 





图 8.16 冰 数 调用 和 程序 调用 


(2) exec/exit 

一 个 C 程序 可 以 fork/exec 另 一 个 程序 ,并 传 给 它 一 些 参 数 。 这 个 被 调用 的 程序 执行 一 
定 的 操作 ,然后 通过 exit(n) 来 返回 值 。 调 用 它 的 进程 可 以 通过 wait(&result) 来 获取 exit 的 
返回 值 。 子 程序 的 exit 返回 值 可 以 在 result 的 8 一 15 位 之 间 找 到 。 

函数 调用 所 用 到 的 堆栈 几乎 是 没有 限制 的 - 一 个 被 调用 的 程序 还 可 以 调用 其 他 程序 ， 
一 个 通过 fork/exec 调用 起 来 的 程序 可 以 通过 fork/exec 调用 别 的 程序 。Unix 使 创建 一 个 
新 进程 方便 而 且 快 捷 。 用 fork/exit 和 exit/wait 来 调用 程序 和 返回 结果 不 仅 适 用 于 shell, 
Unix 程序 经 常 被 设计 成 一 组 子 程序 ,而 不 是 一 个 带 有 很 多 函数 的 大 程序 。 
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由 exec 传递 的 参数 必须 是 字符 串 。 由 于 进程 间 通 信 的 参数 类 型 为 字符 串 RR 
了 子 程序 的 通信 也 必须 使 用 文本 作为 参数 类 型 。 儿 乎 是 偶然 的 ,这 种 基于 文本 的 程序 接口 
支持 跨 平台 的 交互 ,而 这 一 点 非常 重要 。 

2. 全 局 变量 和 fork/exec 

全 局 变量 是 有 害 的 , 它 破坏 了 封装 原则 ,导致 出 人 意料 的 副作用 2 和 难以 维护 的 代码 。 
但 有 时 候 去 掉 全 局 变量 却 更 糟糕 。 怎 么 才能 做 到 不 将 参数 变 得 复杂 的 情况 下 管理 一 堆 每 个 
人 都 要 用 到 的 变量 ?尤其 是 必须 将 它们 向 下 传 几 层 的 时 候 , 情 况 会 更 加 麻烦 。 

Unix 提供 方法 来 建立 全 局 变量 。 环 境 Cenvironment) 是 一 些 传递 给 进程 的 字符 串 型 变 
量 集合 。 不 会 有 副作用 , 它 对 fork/exec 和 exit/wait 机 制 是 一 个 有 用 的 补充 。 下 一 章 将 看 到 
它 如 何 工作 和 如 何 使 用 它 。 


8.7 exit 和 exec 的 其 他 细节 


这 一 章 主 要 学 习 进 程 fork .execvp 和 wait, 但 是 还 需要 再 多 了 解 一 些 关 于 exit 和 exec 
的 细节 。 


8.7.1 进程 死亡 exit 和 exit 


exit 是 fork 的 逆 操 作 ,进程 通过 调用 exit 来 停止 运行 。fork 创建 一 个 进程 ,exit 删除 进 
程 。 基 本 上 是 这 样 。 

exit 刷新 所 有 的 流 ,调用 由 atexit 和 on_exit 注册 的 函数 ,执行 当前 系统 定义 的 其 他 与 
exit 相关 的 操作 。 然 后 调用 _exit。 系 统 函 数 _exit 是 一 个 内 核 操作 ,这 个 操作 处 理 所 有 分 配 
给 这 个 进程 的 内 存 , 关 闭 所 有 这 个 进程 打开 的 文件 ,释放 所 有 内 核 用 来 管理 和 维护 这 个 进程 
的 数据 结构 。 

子 进程 传 给 exit 的 参数 被 如 何 处理 了 ? 那个 进程 的 弥留 之 言 被 存放 在 内 核 直 到 这 个 进 
程 的 父 进程 通过 wait 系统 调用 取 回 这 个 值 。 如 果 父 进程 没有 在 等 这 个 值 ,那么 它 将 被 保存 
在 内 核 直 到 父 进程 调用 wait, 那 时 内 核 将 通告 这 个 父 进程 子 进程 的 结束 ,并 转达 子 进程 的 弥 
留 之 言 。 

那些 已 经 死亡 但 是 还 没有 给 exit 赋值 的 进程 被 称 之 为 幽灵 (zombie) 进 程 。 很 多 比较 新 
的 版 本 的 ps 列 出 这 些 进 程 并 标记 为 defunct。 

_exit() 小 绪 如 下 。 

系统 调用 _exit 终止 当前 进程 并 执行 所 有 必须 的 清理 工作 。 这 些 工作 在 各 个 不 同 版 本 的 
Unix 中 有 些 不 同 ,但 都 包括 以 下 一 些 操作 : 
(1) 关闭 所 有 文件 描述 符 和 目录 描述 符 。 
(2) 将 该 进程 的 PID BW init 进程 的 PID. 
(3) 如 来 父 进 程 调用 wait 或 waitpid 来 等 待 子 进程 结束 , 则 通知 父 进程 。 
(4) B] C ERR AIK SIGCHLD, 


D 有些 人 认为 全 局 变量 会 导致 错误 和 混乱 。 
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. exit 


目标 终止 当前 进程 
头 文 件 # include <unistd. h> 
# include «stdlib. h> 
Fd E. vold exit(int status) 
参数 status 返回 值 
返回 值 无 
相关 内 容 atexit(3) ,exit(3) ,on exit(3) 


这 样 ,如 果 父 进程 在 子 进程 之 前 退出 ,那么 子 进 程 将 能 继续 运行 ,而 不 会 成 为 “孤儿 ”, 它 
们 将 是 init 进程 的 “子女 ”, 这 有 点 像 孤 儿 由 国家 监护 。 注 意 ,就 算 父 进程 没有 调用 wait, 内核 
也 会 癌 它 发 送 SIGCHLD 消息 。 尽 管 对 SIGCHLD 消息 BS BRA BE BE Dy fe 略 的 。 如 果 想 
响应 这 个 消息 ,可 以 设置 一 个 处 理 函 数 。 


8.7.2 exec 家 族 


在 已 经 实现 的 shell 中 和 例 程 中 用 execvp 来 演示 进程 是 如 何 运行 一 个 程序 的 。execvp 
不 是 一 个 系统 调用 , 它 是 一 个 库 函 数 ,这 个 函数 通过 系统 调用 execve 来 调用 内 核 服务 。 
execve 中 的 e 代表 环境 (environment) ,所 以 将 推迟 到 下 一 章 来 讨论 它 。 

还 有 一 些 调用 execve 的 函数 也 是 有 用 的 。 下 面 是 这 个 家 族 中 的 一 些 成 员 ， 


execlp(file,argv0 ,argv!1,... ,NULL) 


execlp 不 像 execvp 那样 用 一 一 个 参数 数组 。 相反 ， 传 给 main 的 argv[] 中 包括 的 参数 被 简 
单 的 放 在 execlp 的 参数 中 。 例 如 : 


execlp( "ls iii ; "ls "m n. 


F 


a", "demodir",NULL); 


以 指定 的 参数 运行 程序 ls。 当 预先 知道 要 运行 的 命令 和 它 的 参数 时 execlp RAN. 
但 是 在 shell 中 ,这 个 函数 没什么 用 ,因为 在 用 户 输入 命令 之 前 不 知道 有 多 少 参数 ， 


execl(fullpath,argvO,argvl,... , NULL); 


execlp 和 execvp 中 的 p (UKE (path), 这 两 个 函数 在 环境 变量 PATH 中 列 出 的 路 
径 中 查找 由 第 一 个 参数 指定 的 程序 。 如 果 准 确 知 道 这 个 文件 的 位 置 , 那 么 就 能 够 在 execl 中 
的 第 一 参数 中 指定 它 的 完整 路 径 。 例 如 


execl( "/bin/ls" ; "ls" "m. 


f 


a", "demodir",NULL); 


以 指定 的 参数 来 运行 程序 /bin/ls。 指 定 程序 的 准确 位 置 比 运行 execlp 更 快 。 因 为 后 者 
要 在 路 径 中 查找 指定 程序 。 指 定 准 确 路 径 也 比 execlp 安全 。 如 果 环 境 恋 量 中 有 错误 的 路 径 
列表 ,那么 可 能 运行 铺 误 的 程序 。 


execv(fullpath,arglist) 
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除了 不 在 PATH 中 查找 程序 文件 外 ,execv 和 execvp 非常 相似 。 第 一 个 参数 必须 是 要 
执行 程序 的 完整 路 径 。 使 用 execv 或 execl 来 执行 明确 指定 的 程序 比 依赖 安全 的 路 径 列 表 
PATH 更 安全 。 因 为 PATH 很 容易 被 恶意 的 用 户 算 改 ，。 


2. 


小 8 


. 主要 内 容 


Unix 通过 将 可 执行 代码 载 人 进程 并 执行 它 来 运行 一 个 程序 。 进 程 是 运行 一 个 程序 
所 需 的 内 存 空间 和 其 他 资源 的 集合 。 
每 个 运行 中 的 程序 在 自己 的 进程 中 和 运行。 每 个 进程 都 有 一 个 惟一 的 进程 ID、 所 有 
者 .大 小 及 其 他 属性 。 
系统 调用 fork 通过 复制 进程 来 建立 一 个 几乎 和 原来 进程 完全 相同 的 副本 进程 。 这 
个 新 建 的 进程 被 称 为 子 进程 。 

一 个 程序 通过 调用 exec 函数 族 在 当前 进程 中 执行 一 个 新 的 程序 。 
一 个 程序 能 通过 调用 wait 来 等 待 子 进程 结束 。 
调用 程序 能 将 一 个 字符 串 列表 传 给 新 程序 的 main 函数 。 新 的 程序 能 通过 调用 exit 
来 回 传 一 个 8 位 长 的 值 。 
Unix shell 通过 调用 fork exec 和 wait 来 运行 程序 。 
进一步 的 问题 


shell 运行 程序 ,同时 shell 也 是 一 种 编程 语言 。 下 面 将 学 习 shell 的 脚本 语言 。 还 要 看 
看 如 何 修 改 程序 以 支持 脚本 控制 逻辑 和 变量 。 


3. 


习题 


8.1 从 fork 返回 的 值 能 够 区 分 父 进 程 还 是 子 进程 ? 还 有 其 他 的 办 法 做 到 这 一 点 吗 ? 


8.2 预测 下 面 程序 的 输出 : 


main() 
{ 
int n; 
for(n = 0; n<10 ; n**) 
( 
printf("my pid = $d, n = %d\n", getpidO , n); 


sleep(1); | 
if (fork() t= 0) /* what if these two x/ 
exit(0); /* lines were removed x/ 


} 
j 


如 果 把 有 注解 的 两 行 删除 ,结果 又 会 如 何 ? 


8.3 psh2.c 使 用 了 定 长 的 数组 来 存放 参数 列表 。 如 何 修改 程序 才能 去 掉 用 户 输入 命 


令 参 数 个 数 的 限制 ? 这 样 的 改动 有 必要 吗 ? 这 就 是 说 , Unix 是 否 限制 了 exec 可 
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接受 的 参数 长 度 或 个 数 ? 
8.4 考虑 以 下 代码 ， 
main() 
{ int fd; 
int pid; 


"Test 123 .. An"; 
"Hello, hello\n"; 


char msgl|] = 
char msg2[ ) = 
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if ( (fd = creat(tesefile, 0644)) == -1) 
return 0; 

if ( write(fd, msgl, strlen(msgl)) == -1) 
return 0; 

if ( (pid = fork()) == -1) 
return 0; | 

if ( write(fd, msg2, strlen(msg2)) == -1) 
return 0; 


close(fd); 
return 1; 


} 


测试 这 个 程序 。 调 用 fork 之 后 两 个 进程 都 有 一 个 指向 同一 个 输出 文件 并 且 具 有 
相同 的 当前 位 置 的 文件 描述 符 。 文 件 中 会 有 几 条 记录 ? 能 否 从 记录 的 条 数 得 知 


文件 描述 符 和 连接 的 文件 ? 
8.5 考虑 下 面 代码 : 


# include <(stdio. h> 
main( ) 


{ 
FILE * fp; 
int pid; 
char msgi|] = "Test 123..\n"; 


char msg2| ] = "Hello, hello\n"; 


if ( (fp = fopen("testfile2", "w")) 
return 0; 

fprintf(fp, "€ s", msgl); 

if ( (pid = fork()) == -1) 
return 0; 


fprintf(fp," $ s",msgz); 
fclose(fp); 
return 1; 


} 
测试 这 个 程序 。 文 件 中 有 多 少 条 记录 ? 
本 中 的 forkdemol. c 的 输出 比较 一 下 。 


NULL) 


解释 一 下 结果 。 将 这 个 程序 的 输出 与 课 
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8.6 编译 并 运行 以 下 程序 ， 
main() 
{ 
int i; 
if (fork() 1= 0) 
exit(0); 
for( i21; i<= 10 ;it-*)l 
printf("still here. .\n"); 
sleep(i) > 
} 


return 0; 


解释 程序 做 了 些 什么 ,怎么 工作 的 ,Unix shell 允许 用 户 在 后 台 运 行程 序 。 这 个 程 
序 与 后 台 进 程 有 什么 相似 之 处 ? 


8.7 ”如 果子 进程 运行 失败 ,程序 调用 exite WH exit 看 起 来 很 极端 。 为 什么 不 仅仅 从 
晒 数 中 返回 出 错 代 码 ? 


4. 编程 练习 

8.8 扩展 waitdemol.c 的 功能 ,使 之 建立 两 个 进程 ,并 等 待 两 个 进程 都 结束 。 | 
进一步 扩展 你 的 程序 使 之 能 从 命令 行 接受 整数 。 然 后 程序 创立 该 整数 指定 的 进程 数 。 
分 配 每 个 进程 一 个 随机 的 睡眠 时 间 。 最 后 , 父 进程 报告 每 个 子 进 程 的 退出 。 


8.9 号 个 程序 来 帮助 理解 SIGCHLD., fr waitdemo2. c, 设 置 SIGCHLD 信号 的 处 理 
哎 数 。 然 后 执行 循环 ,每 一 秒 打印 一 次 "waiting"。 当 子 进程 退出 ,程序 打印 消息 ， 
报告 退出 原因 然后 退出 。 


8.10 与 一 个 程序 接受 一 个 整数 作为 参数 ,然后 创建 参数 指定 个 数 的 子 进 程 。 每 个 子 
进程 睡眠 5 秒 钟 ,然后 退出 。 父 进程 设置 SIGCHLD 的 信号 处 理 函 数 。 然 后 进入 
循环 ,每 秒 打印 一 次 消息 。 信 和 号 处 理 函 数 调 用 wait, 然 后 打印 子 进程 的 ID, 最 后 
将 计数 器 增 1。 当 计数 器 达到 建立 的 子 进程 数 时 ,程序 退出 。 用 不 同 数目 的 子 进 
程 数 来 测试 程序 。 当 子 进程 数 很 大 时 程序 可 能 会 丢失 一 些 子 进 程 退 出 的 消息 。 
能 解释 为 什么 会 有 消息 丢失 吗 ? 有 没有 办 法 解决 ? 


8.11 修改 psh2.c 使 之 在 用 户 输入 “exit” 或 遇 到 文件 结束 时 退出 。 


8.12 当 有 子 进程 在 运行 时 ,标准 Unix shell 在 用 户 发 送 中 断 或 退出 信号 时 并 不 终止 。 
接受 命令 行 时 ,标准 的 Unix shell 如 何 响应 这 些 信号 ? 修改 psh2. c, 使 之 像 一 个 
标准 的 shell 那样 工作 。 
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概念 与 技巧 

。 Unix shell 是 一 种 编程 语言 

。 什么 是 shell 脚本 语言 ? shell 如 何 处 理 脚本 语言 ? 
* shell 如 何 处 理 结 构 化 的 工作 ? exit(0) = success 
。 为 什么 需要 shell 变量 以 及 如 何 使 用 shell 变量 

。 什么 是 环境 ? 它 是 如 何 工 作 的 ? 

相关 的 系统 调用 

* exit 

。 getenv 

相关 命令 


* env 


9.1 shell 编程 


在 shell 中 可 以 运行 程序 ,而 shell 本 身 就 是 一 种 编程 语言 。shell 程序 ,一 般 称 之 为 shell 
脚本 ,是 Unix 的 重要 部 分 , Unix 的 引导 程序 和 很 多 管理 程序 都 使 用 shell 脚本 。 本 章 中 , 首 
先 学 习 shell 的 编程 特征 。 然 后 在 上 一 章 编写 的 shell 程序 中 增加 一 些 特征 ,将 if. . then 控制 
语句 、 局 部 变量 和 全 局 变量 添加 到 要 实现 的 shell 程序 中 。 


9. 2 什么 是 以 及 为 什么 要 使 用 shell 脚本 语言 


shell 是 一 个 编程 语言 解释 器 ， 这 个 解释 器 解释 从 键盘 输入 的 命令 ,也 解释 存储 在 脚本 中 
的 命令 序列 。 


shell 脚本 包含 一 系列 命令 
shell 脚本 是 一 个 包含 一 系列 命令 的 文件 。 运 行 一 个 脚本 就 是 运行 这 个 文件 中 的 每 个 合 
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。 可 以 用 一 个 shell 脚本 在 一 次 请 求 中 来 执行 多 个 命令 。 下 面 是 一 个 例子 : 


# this is called scriptO 

# it runs some commands 

ls 

echo the current date/time is . 
date 

echo my name is 


whoami 


前 两 行 是 注释 。shell 忽略 以 字符 # 开 始 的 行 ,脚本 的 余下 部 分 由 命令 组 成 ,shell 逐条 


执行 命令 直到 文件 末尾 或 者 shell 执行 到 exit 命令 。 


可 以 把 脚本 文件 名 作为 参数 传 给 shell 来 执行 脚本 : 


$ sh scriptO 

ScriptO scriptl script2 script3 
the current date/time is 

Sun Jui 29 23-29-49 EDT 2001 

my name is 

bruce 


$ 


还 可 以 通过 设置 文件 的 执行 权限 ,然后 输入 文件 名 来 执行 脚本 : 


$ chmod + x script0 

$ scriptO 

ScriptO scripti script2 script3 
the current date/time is 

Sun Jul 29 23:31:23 EDT 2001 

my name is 

bruce 


$ 


对 于 一 个 脚本 只 需要 执行 一 次 chmod, 可 执行 位 将 保持 不 变 直到 下 一 次 再 改变 它 。 用 第 


二 种 方法 ,也 就 是 用 改变 文件 可 执行 属性 的 方法 来 启动 脚本 会 更 加 方便 。 将 脚本 设置 成 可 
执行 的 ,然后 像 运行 系统 命令 或 自己 编写 的 程序 一 样 来 执行 脚本 。 


将 使 用 哪个 shell? 我 们 将 学 习 和 编写 脚本 的 shell 是 一 个 早期 版 本 的 Unix shell: sh 的 


| 语法 ERFA B shell(Bourne Shel) ,这 是 根据 编写 这 个 程序 的 人 的 名字 来 命名 的 。 过 去 
的 几 年 中 有 很 多 不 同 的 shell 被 实现 ,它们 各 有 各 的 特点 或 语法 。 这 里 将 学 习 的 语法 在 大 多 
数 shell 中 是 相同 的 ,包括 sh bash 和 ksh, 


l. sh 的 编程 特征 :变量 .I/O 和 if.. then 
shell 脚本 是 真正 的 程序 。 注 意 在 script2 中 体现 的 特点 : 
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i! /bin/sh 
it script2 : a real program with variables, input, 


# and control flow 


BOOK = SHOME/phonebook. data 
echo find what name in phonebook 
read NAME 
if grep $ NAME $ BOOK > /tmp/pb. tmp 
then 

echo Entries for S NAME 

cat /tmp/pb. tmp 
else 

echo No entries for $ NAME 
fi 
rm /tmp/pb. tmp 


下 面 是 script2 的 输出 : 


$ ./script2 

find what name in phonebook 
dave 

Entries for dave 

dave 432 — 6546 

$ ./script2 

f ind what name in phonebook 
fran 

No entries for fran 

$ cat SHOME/phonebook. data 


ann 222 — 3456 

bob 323 — 2222 

carla 123 — 4567 

dave 432 — 6546 

eloise 567 ~ 9876 

$ 

脚本 中 除了 命令 之 外 还 包括 以 下 元 素 。 
(1) 变量 


脚本 中 可 以 定义 变量 。 在 script2 中 ,定义 了 名 为 BOOK 和 NAME 两 个 变量 ,并 在 定义 
之 后 使 用 了 它们 ,用 前 缀 $ 来 取得 变量 的 值 。 变 量 名 不 一 定 要 大 写 , 只 是 习惯 上 将 其 大 写 。 

(2) 用 户 输入 . | 

read 命令 告诉 shell 要 从 标准 输入 中 读 人 一 个 字符 串 。 可 以 使 用 read 来 创建 交互 的 脚 
本 ,也 可 以 从 文件 或 管道 中 读 人 数据。 

(3) 控制 

这 个 脚本 包括 了 if.. then.. else. .fi 控制 语句 。 其 他 的 脚本 控制 语句 还 有 while, case 
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和 for, 

(4) 环境 

脚本 使 用 一 个 名 为 HOME 的 变量 。HOME 的 值 是 你 的 主 目录 的 路 径 。HOME 变量 是 
由 login 程序 设置 的 ,可 以 被 login 进程 的 所 有 子 进程 使 用 。HOME 变量 是 多 个 环境 变量 
(environment variables) 中 的 一 个 。 这 些 环境 变量 记录 了 个 性 化 设置 。 而 这 些 设置 能 影响 很 
多 程序 的 行为 。 比 如 ,TZ 变量 记录 了 当前 的 时 区 。 将 TZ 设置 为 "EST5EDT" 是 告诉 那些 使 用 
ctime 的 程序 ,比如 date 或 ls -1, 应 该 显示 美国 东部 时 间 。 本 章 后 面 会 学 习 环 境 变量 的 作 
HAH. 

2. B 4 shell 的 改进 

在 上 一 章 用 fork execvp 和 wait 实现 了 一 个 能 够 创建 进程 和 运行 程序 的 shell, AB 
中 ,将 对 这 个 shell 做 一 些 改进 。 首 先 ,将 加 入 命令 行 解析 。 这 样 用 户 就 能 够 在 一 行 中 输入 命 
令 和 所 有 参数 了 。 然 后 ,将 控制 语句 让 . then 加 入 到 这 个 shell 中 。 最 后 将 加 入 局 部 变量 和 
环境 变量 。 


9.3 Smsh1 一 -一 命令 行 解 析 
对 目 编 shell 的 第 一 个 改进 是 添加 命令 行 解析 的 功能 。 这 个 版 本 命名 为 smshl.c, AAP 


find /home — name core - mtime +3 - print 


然后 由 解析 器 将 命令 行 拆 成 字符 串 数 组 ,以 便 传 给 execvp。 程 序 主要 流程 如 图 9. 1 所 示 。 
对 psh2. c 的 改进 包括 将 命令 行 分 解 成 参数 数组 ,在 shell 中 忽略 信号 SIGINT 和 SIGQUIT, 
但 是 在 子 进 程 中 恢复 对 信号 SIGINT 和 SIGQUIT 的 默认 操作 ,允许 用 户 通过 按 表 示 结 束 文 
件 的 Ctrl-D 键 来 退出 。 


ignote signals 








—— ——* get command —~- —— — exit 
split line 
| 
[ fork — 
| 


execvp 
_ | exit 


图 9.1 一 个 有 信号 . 通 出 和 解析 的 shell 





| watt enable signals 





* 264 * Unix/Linux 编程 实践 教程 


shell AY = pha F : 


int main() 


{ 
char x cmdline, * prompt, * x arglist; 
int result; 


void setup() ; 


prompt = DFL_PROMPT ; 
setup() ; 
while ( (cmdline = next cmd(prompt, stdin)) ! = NULL ){ 


if ( (arglist = splitline(cmdline)) ! = NULL ){ 


result = execute(arglist); 


"~ -w o 


freelist(arglist); 
) 


free(cmdline); 


} 


return 0; 


} 
3 个 函数 的 解释 如 下 。 


(1) next_cmd 


next. cmd 从 输入 流 中 读 人 下 一 个 命令 。 它 调用 malloc 来 分 配 内 存 以 接受 任意 长 度 的 
命令 行 。 碰 到 文件 结束 符 , 它 返回 NULL. 

《2) splitline 

splitline 将 一 个 字符 串 分 解 为 字符 串 数 组 ,并 返回 这 个 数组 。 它 调用 malloc 来 分 配 内 存 
以 接受 任意 参数 个 数 的 命令 行 。 这 个 数组 由 NULL 标记 结束 ， 

(3) execute 

execute 使 用 fork execvp 和 wait 来 运行 一 个 命令 。execute 返回 命令 的 结束 状态 。 

smshl 由 3 个 文件 组 成 :smshl. c.splitline. c 和 execute. c, 用 以 下 命令 来 编译 和 运行 这 


个 程序 : 


$ cc smshi.c splitline.c execute.c - o smshl 
$ ./smshi 

>ps -f 

UID PID PPID 
bruce 23203 23199 
bruce 25383 23203 
bruce 25385 25383 
> EX BR Ctrl-D # 
$ 


注意 ps —f Æ. /smshl 的 子 进程 。. /smshl 是 bash 的 子 进程 。 下 面 是 smshl. c 的 代码 ， 


STIME TTY TIME CMD 
Jui29 pts/4 00-00-00 bash 
08.23 pts/4 00:00:00 . / smshi 
08:23 pts/4 00:00:00 ps -f 


O 2 o o0 
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/** smshl.c small- shell version 1 
x first really useful version after prompting shell 
** this one parses the command line into strings 
x uses fork, exec, wait, and ignores signals 
xx / 


# include <stdio.h> 

# include  «stdlib. h> 
# include <“unistd. h> 
# include «signal. h> 


# include  "smsh.h" 


# define DFL PROMPT ">" 


int main() 

{ 
char x cmdline, * prompt, * x arglist; 
int result; 


void setup(); 


prompt = DFL PROMPT ; 
setup() ; 


while ( (cmdline = next cmd(prompt, stdin)) ! = NULL ) { 


if ( Carglist = splitline(cmdline)) {= NULL ){ 


result = execute(arglist); 


freelist(arglist); 
) 
free(cmdline); 


} 


return 0; 


} 


void setup() 
/* 
* purpose: initialize shell 
x returns; nothing. calls fatal() if trouble 
x/ 
{ 
signal(SIGINT, SIG_IGN); 
signal(SIGQUIT, SIG IGN); 
j 


void fatal(char * sl, char * s2, int n) 
{ 
fprintf(stderr, "Error: % s, % s\n", sl, s2); 


exit(n); 
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266 。 Unix/Linux 编程 实践 教程 


下 面 是 execute. c 的 代码 : 


/* execute.c - code used by small shell to execute commands x/ 


# include +(stdio. h> 

# include «< stdlib. h> 
# include <Cunistd. h> 

H include <«< signal. h> 

# include <(sys/wait. h> 


int execute(char x argv| ]) 
[x 
* purpose: run a program passing it arguments 


* returns; status returned via wait, or ~ 1 on error 


* errors: — 1 on fork() or wait() errors 
x/ 
{ 

int pid ; 

int child info = -1; 


Fr 


if (argv[0] == NULL) /x nothing succeeds«/ 


return 0; 


if ( (pid = fork()) == -1) 
perror("fork"); 
else if ( pid == 0){ 
Signal(SIGINT, SIG DFL); 
signal(SIGQUIT, SIG DFL); 
execvp(argv[0], argv); 
perror("cannot execute command"); 
exit(1); 
j 
else ( 
if ( wait(&child info) == -1) 
perror("wait"); 
} 


return child info; 


FÉ splitline. c HARE: 


/* splitline.c — commmand reading and parsing functions for smsh 
* 
x char * next cmd(char x prompt, FILE x fp) 一 get next command 


* char ** splitline(char x str); - parse a string 
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*/ 


# include <(stdio.h> 
# include <(stdlib. h> 
# include «string. h> 


# include  "smsh.h" 


char * next cmd(char x prompt, FILE * fp) 
/* 
* purpose: read next command line from fp 
* returns; dynamically allocated string holding command line 
* errors; NULL at EOF (not really an error) 
x calls fatal from emalloc() 


* notes; allocates space in BUFSIZ chunks. 


*/ 

{ 
char x buf ; /* the buffer x/ 
int bufspace = 0; /* total size x/ 
int pos = 0; /* current position x/ 
int C; /x input char x/ 
printf("5* s", prompt); /* prompt user x/ 


while( ( c = getc(fp)) 1= EOF ) { 


/* need space? x/ 
if ( pos + 1 >= bufspace )( /* 1 for NO «/ 
if ( bufspace == 0) /x y: lst time x/ 
buf = emalloc(BUFSIZ) ; 
els& or expand x/ 
buf = erealloc(buf,bufspace + BUFSIZ) ; 
bufspace += BUFSIZ; /* update size x/ 


/* end of command? x/ 
if ( Q == "Án! ) 
break; 


/* no, add to buffer x/ 
buf[post*t ] = c; 

) 

if(c -- EOF && pos == 0) /* EOF and no input x/ 
return NULL; /* say so x/ 

buffpos] = "0'; — 


return buf; 


/** 
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x* splitline ( parse a line into an array of strings ) 
xx / 
f define is delim(x) (G0 ==' '[|(x) == '\t') 


char xx splitline(char x line) 


/* 


x purpose: split a line into array of white - space separated tokens 


* returns :a NULL ~ terminated array of pointers to copies of the 


* 


tokens or NULL if line if no tokens on the line 


* action; traverse the array, locate strings, make copies 


* note: strtok() could work, but we may want to add quotes later 


*/ 


char  * newstr(); 


char **args ; 


int spots = 0; /x spots in table x/ 
int bufspace = 0; | /* bytes in table */ 
int argnum = 0; /* slots used */ 
char *cp = line; /* pos in string x/ 


char * start; 


int len; 
if ( line == NULL ) /* handle special casex/ 
return NULL: 
args = emalloc(BUFSIZ) ; /* initialize arrayx/ 
bufspace = BUFSIZ; 
spots = BUFSIZ/sizeof(char *); 
while( *cp !* 'X0') 
( 
while ( is delim( * cp) ) /x skip leading spaces */ 
cptt ; 
if ( *cp == "\0o") /x quit at end- o- string */ 
break; 


/* make sure the array has room ( + 1 for NULL) */ 
if ( argnum +1 >= spots )( 
args = erealloc(args,bufspace + BUFSIZ) ; 
bufspace += BUFSIZ; 
spots += (BUFSIZ/sizeof(char *)); 
} 


/x mark start, then find end of word x/ 
start = cp; 
len = 1; 


while (* **cp!* '\0' && ! (is delim( * cp)) ) 
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len++ ; 
args{argnum++ ] = newstr(start, len); 
} 
args[argnum] = NULL; 
return args; 


} 
/* 


* purpose: constructor for strings 
* returns; a string, never NULL 
char * newstr(char x s, int 1) 
{ 


char * rv = emalloc(1+1); 


rvLlj = 'W0'; 
strncpy(rv, s, 1); 


return rv; 


void freelist(char * * list) 
/* 
* purpose; free the list returned by splitline 
* returns: nothing 
* action: free all strings in list and then free the list 
x/ 
( 
char **cp = list; 
while( x cp) 
free( * cp t ); 
free(list); 


void x emalloc(size t n) 


{ 


void *rv,; 
if ( (rv = malloc(n)) == NULL ) 
fatal( "out of memory" , " "1,12; 
return rv; 
} 
void * erealloc(void * p, size t n) 
{ 
void * rv; 
if ( (rv = realloc(p,n)) == NULL) 
fatal("realloc() failed","",1); 


return rv; 
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下 面 是 smsh. h 的 代码 : 


i define YES 1 
+ define NO 0 


char  * next cmd(); 

char xx splitline(char x); 

void freelist(char xx); 

void  * emalloc(size t); 

void  * erealloc(void * , size t); 
int | execute(char xx); 


void fatal(char x , char x 


XT smshl 的 解释 
(1) 一 行 多 个 命令 


通常 的 shell 允许 用 分 号 分 隔 命令 ,这 样 用户 就 可 以 在 一 行 中 输入 多 个 命令 了 : 


int ); 


f 


ls demodir; ps -f ; date 


(2) I f& xit fe 

通常 的 shell 允许 用 户 通 过 在 命令 的 结尾 加 上 与 符号 (&) 来 使 其 在 后 台 运 行 ,如 : 

find /home - name core - print & 

在 后 台 运 行 一 个 程序 意味 着 一 旦 启动 它 , 系 统 将 立即 返回 提示 符 , 这 个 进程 可 能 还 没有 
结束 ,但 已 经 可 以 在 提示 符 后 输入 命令 并 运行 其 他 进程 了 。 这 上 听 起 来 有 点 复杂 ,实际 上 实现 
是 非常 简单 。 看 看 流程 图 , 想 想 是 如 何不 等 待命 令 结束 而 返回 提示 符 的 。 想 法 很 简单 而 且 
漂亮 ,但 是 要 处 理 信 号 和 防止 僵尸 (Zombies) 进 程 , 这 有 点 像 惊 险 片 。 

(3) 退出 命令 

通常 的 shell 允许 用 户 通过 输入 exit 来 退出 shell, exit 命令 接受 一 个 整数 参数 ,比如 
exit 3, 这 种 情况 下 ,这 个 数字 被 作为 参数 传 给 exit HR, 


9.4 shell 中 的 流程 控制 


对 原 有 的 shell 的 第 2 个 改进 是 增加 if.. then 控制 语句 。 
9.4.1 证 语句 做 些 什 么 
shell 提供 过 控制 语句 。 假 设 你 计划 每 周 五 做 磁盘 备份 。 考 虑 一 下 以 下 例子 ， 


if date| grep Fri 
then 
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echo time for backup. Insert tape and press enter 
read x 
tar cvf /dev/tape /home 

fi 


shell 中 的 计 语 句 的 作用 与 其 他 语言 的 让 语 句 相 同 : 条 件 检测 。 如 果 条 件 的 值 为 正 , 则 有 
”一 部 分 代码 被 执行 。 在 shell 中 ,条 件 是 一 个 命令 ,返回 正 值 意味 着 命令 运行 成 功 。 
在 例子 中 ,命令 是 date| grep Fri, 这 个 命令 在 date 的 输出 字符 串 中 查找 “Fri” 字 符 串 , 如 
， 果 找到 则 命令 成 功 ,否则 命令 失败 。 程 序 是 如 何 表示 成 功 的 呢 ? 

(1) exit(0) 代 表 成 功 

grep 程序 调用 函数 exit(0) 来 表明 成 功 。 所 有 的 Unix 程序 都 遵从 以 0 退出 表明 成 功 这 
一 惯例 。 比 如 ,diff 命令 用 来 比较 两 个 文本 文件 。 如 果 两 个 文件 相同 ,diff 返回 0 以 表明 成 
功 。 类 似 地 ,mv、cp 和 rm 都 以 相同 的 方式 表明 成 功 。 脚 本 中 的 if.. then 语句 基于 以 0 退出 
表示 成 功 这 个 假设 。 

(2) #4 else 的 让 语句 

一 个 if iB AA] EUR. else 部 分 ,比如 : 


ls 

who 

if diff filel filel.bak 

then 
echo no differences found, removing backup 
rm filel.bak 

else 
echo backup differs, making it read - only 
chmod ~ w filel. bak 

fi 

date 


else 部 分 就 像 then 部 分 一 样 ,可 以 包含 任意 数量 的 命令 ,包括 其 他 的 if. . then 语句 。 
让 语句 还 有 另 一 个 特征 。 如 果 计 后 的 条 件 是 一 系列 的 命令 ,那么 最 后 一 个 命令 的 exit 值 
被 用 作 这 个 语句 块 的 条 件 值 ,并 由 此 来 决定 条 件 是 否 成 立 。 


9.4.2 证 是 如 何 工作 的 


if 语句 的 工作 流程 主要 如 下 。 
(1) shell 运行 让 之 后 的 命令 。 
(2) shell 检查 命令 的 exit RA, 
《3) exit 的 状态 为 0 意味 着 成 功 , 非 0 意味 着 失败 。 
(4) 如 果 成 功 ,shell 执行 then 部 分 的 代码 。 
(5) 如 果 失 败 shell 执行 else 部 分 的 代码 。 
(60 KES fi Pik 寺 块 的 结束 。 
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9.4.3 在 smsh 中 增加 证 


现在 已 经 知道 让 控 制 语句 做 什么 ,也 知道 它 是 如 何 工 作 的 。 那 么 如 何在 shell 中 增加 if 
T8 n] WE 2 
这 里 已 经 知道 如 何 运 行 一 人 。 也 知道 如 何 检 查 一 个 程序 的 退出 状 
态 一 一 从 wait 函数 中 得 到 。 需 要 将 {之 后 命令 的 结果 存放 在 一 些 变量 中 ,然后 要 知道 后 面 
读 入 的 命令 是 在 then 块 中 ,还 是 else 块 中 。 最 后 还 得 确保 在 让 之 后 读 入 then, 
(1) 增加 一 层 ;process | 
要 实现 这 些 功 能 ,原来 的 模型 就 有 些 太 简单 。smshl 的 控制 流 从 splitline 直接 到 fork, 
每 个 命令 都 被 直接 传 给 exec。 新 的 版 本 中 ,以 让 ,then RH fi FA MAA then 语 
名 块 中 的 命令 行 不 传 给 exec. UU if 语句 后 使 命令 处 理 变 得 复杂 ,所 以 要 写 一 个 名 为 
process 的 函数 来 包含 这 些 复杂 的 代码 。 修 改 后 的 流程 图 如 图 9. 2 所 示 。 





sinshl smsh2 
ignore signals ignore signals 
—— —» getcommand ——-» exit r— — > get command 一 一 —» exit 
split line split line 


control command? 


| | 
| 
| r— fork 一 一 | n 
| wait enable signals | 一 fork ”一 一 E 
| | areas | enable signals 方 框 内 是 函数 
| | | | Cxecvp process 
| d a exit | i 
L exit 





图 9.2 Æ smsh 中 增加 流程 控制 


(2) process 做 些 什么 

process 通过 寻找 关键 字 ,比如 if then 和 ,来 管理 脚本 流程 ,在 适当 的 时 候 调 用 fork 和 
exec, process 必须 记录 条 件 命令 的 结果 以 便 能 够 处 理 then 和 else H, 

(3) procss 是 如 何 工 作 的 ?代码 区 域 运行 状态 

process 将 脚本 看 作 一 个 接 一 个 的 代码 区 域 。 第 1 个 区 域 是 then 代码 块 ,第 2 个 是 else 
代码 块 ,第 3 个 是 在 ff 语句 之 外 的 代码 块 。 就 像 图 9. 3 所 示 , 对 于 不 同 的 区 域 ,shell 的 处 理 
方法 也 是 不 同 的 。 

考虑 if 语句 之 外 的 区 域 ,这 里 称 之 为 中 立 区 (neutral) 。 对 于 这 类 区 域 的 代码 ,简单 地 读 
一 条 ,分 析 一 条 ,执行 一 条 。 

接 下 来 是 在 if then 之 间 的 区 域 。 这 个 区 域 中 ,shell 每 执行 一 条 命令 就 记录 下 它 的 退 
出 状态 , 另 一 个 区 域 是 从 then 到 fi R else 之 间 , 最 后 一 个 区 域 是 从 else 到 下 ,在 二 之 后 又 回 
到 中 立 区 了 。 

shell 记录 当前 区 域 类 型 ,还 必须 记录 在 WANT. THEN ra NETH HO, 
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Ki shell 的 输入 序列 








ls 


中 立 区 who 

if diff filel filel.bak 
want-then then 

rm filel.bak 

then-block echo removing backup 
| else 
else-block chmod -w filel.bak 
中 立 区 


图 9. 3 由 不 同 区 域 组 成 的 脚本 


不 同 区 域 的 处 理 方法 是 不 同 的 。 特 定 的 区 域 与 程序 的 特定 状态 联系 在 一 起 。process 通 
过 3 个 函数 来 处 理 区 域 问题 。 | 

(1) is control command - 

is control command 返回 一 个 boolean 变量 告诉 process 这 条 命令 是 脚本 语言 的 一 部 分 
还 是 一 条 可 执行 的 命令 。 

(2) do control command 

do control command Ab Ei C S =F if. then M fi, 每 个 关键 字 都 是 区 域 的 界 标 。 iX > PR 
数 更 新 状态 变量 并 执行 必要 的 操作 。 

(3) ok to execute 

ok to execute 根据 当前 的 状态 和 条 件 命令 的 结果 返回 一 个 boolean 值 ,说 明 能 否 执行 
当前 命令 。 


9.4.4 Smsh2.c: 修 改 后 的 代码 


smsh2. c 是 基于 smshl.c 的 。main 函数 只 有 一 处 需要 改动 一 -调用 execute 的 地 方 调 
用 process J: 


/xx smsh2.c - small- shell version 2 
xx small shell that Supports command line parsing 
x and if..then..else.fi logic (by calling process()) 
x / 
# include <(stdio.h> 
include <stdlib.h> 
# include <unistd. h> 
# include <signal. h> 
# include <sys/wait. h> 


# include  "smsh.h" 
it define DEL PROMPT ">" 


int main() 
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char x cmdline, x prompt, ** arglist; 
int result, process(char **); 


void setup(); 


prompt - DFL PROMPT ; 
setup(); 


while ( (cmdline = next cmd(prompt, stdin)) ! = NULL ){ 
if ( (arglist = splitline(cmdline)) ! = NULL ){ 
result = process(arglist); 
freelist(arglist) ; 
} 
free(cmdline) ; 


} 


return 0; 


void setup() 
/* 
* purpose: initialize shell 
* returns; nothing. calls fatal() if trouble 
x/ l 
{ 
signal(SIGINT, SIG_IGN); 
signal(SIGQUIT, SIG IGN); 


void fatal(char * s1, char x s2, int n) 
{ 
fprintf(stderr, "Error; % s, %s\n", sl, s2); 


exit(n) ; 


还 添加 了 两 个 新 文件 ,process. c 和 controlflow. c; 


/* process.c 

* command processing layer 

* 

* The process(char x arglist) function is called by the main loop 
* It sits in front of the execute() function. This layer handles 

* two main classes of processing: 

* a) built - in functions (e.g. exit(), set, =, read, ..) 


* b) control structures (e.g. if, while, for) 


x/ 


iinclude <stdio.h> 
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H include "smsh. h" 


int is control command(char x); 
int do control command(char ** 9); 


int ok to execute(); 


int process(char x * args) 
/* 
* purpose: process user command 


* returns: result of processing command 


* details; if a built- in then call appropriate function, if not 


execute( ) 


* errors: arise from subroutines, handled there 
*/ 


int rv = 0. 


r 


if (args[0] == NULL) 
rv = 0; 
else if ( is control command(args[0 |) ) 
rv = do control command(args); 
else if ( ok to execute() ) 
rv = execute(args); 


return rv; 
/* controlflow.c 


x "if" processing is done with two state variables 
x if state and if result 

x/ 

# include <cstdio. h> 


i include  "smsh.n" 


enum states { NEUTRAL, WANT THEN, THEN BLOCK }; 
enum results { SUCCESS, FAIL j; 


static int if state - NEUTRAL; 
static int if result - SUCCESS; 
0. 


f 


static int last_stat 
int syn err(char x); 


int ok to execute() 
/* 
* purpose: determine the shell should execute a command 


* returns; 1 for yes, 0 for no 


* details : if in THEN BLOCK and if result was SUCCESS then yes 
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* if in THEN BLOCK and if result was FAIL then no 
x if in WANT THEN then syntax error (sh is different) 
*/ 
{ 
int rv = 1; /* default is positive x/ 
if ( if state == WANT THEN ){ 


syn err("then expected"); 


rv = 0; 

j 

else if ( if state -- THEN BLOCK && if result -- SUCCESS ) 
rv = 1; 

else if ( if state == THEN BLOCK && if result == FAIL ) 
rv = 0; 


return rv; 


int is control command(char x s) 
/x 
* purpose: boolean to report if the command is a shell control command 
x returns: Oor 1 
x/ 
{ 
return (strcmp(s,"if") ==0 || stremp(s, "then") ==0 | | 


stremp(s, "fi") ==0); 


int do control command(char x * args) 
/* 
* purpose: Process "if", "then", "fi" — change state or detect error 
* returns; 0 if ok, — 1 for syntax error 
x/ 
( 
char *cmd = args[0]; 


int rv = -1; 


if ( stremp(cmd, "if") ==0 ){ 
if ( if state ! - NEUTRAL ) 
rv = syn err("if unexpected"); 
else ( 
last stat = process(args * 1); 
if result = (last stat == 0 ? SUCCESS : FAIL); 
if state - WANT THEN; 
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else if ( stremp(cmd, "then") == 0 ){ 
if ( if state ! = WANT THEN ) 
rv = syn err("then unexpected"): 
else | 
if state - THEN BLOCK; 


rv = 0; 


} 
else if ( strcemp(cmd, "fi") ==0 ){ 
if ( if state ! - THEN BLOCK ) 


rv = syn err("fi unexpected"); 


else | 
if state - NEUTRAL; 
rv = 0; 
} 
} 
else | 


fatal("internal error processing;", cmd, 2); 


return rv; 


} 


int syn err(char x msg) 
/* purpose: handles syntax errors in control structures 
* details; resets state to NEUTRAL 
* returns; —1 in interactive mode. Should call fatal in scripts 
*/ 
1 
if state - NEUTRAL; 
fprintf(stderr, "syntax error; * s\n", msg); 


return — 1; 


在 controlflow. c 中 ,if 语句 的 else 没有 被 处 理 , 这 一 部 分 留 作 读者 的 习题 。 
编译 并 执行 这 个 版 本 : 


$ cc -o smsh2 smsh2.c splitline.c execute. c process.c controlflow.c 
S ./smsh2 

> grep lp /etc/passwd 
ip:x:4:7;lp;/var/spool/lpd; 
> if grep lp /etc/passwd 
lp:x:4:7 :1p:/var/spool/lpd: 
> then | 

> echo ok 

ok 

> fi 
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> if grep pati /etc/ passwd 
> then 

> echo ok 

> fi 

> echo ok 

ok 

> then 


syntax error; then unexpected 


做 得 如 何 ? 


看 起 来 做 得 不 错 。 那 么 和 常用 的 shell 比 起 来 又 如 何 呢 ? 


if grep lp /etc/passwd 
then 

echo ok 
fi 


Ur d in in 


lp:x:4 :7 :lp:/var/spool/ipd: 
ok 
3 


这 个 shell 处 理 计 语 名 的 方法 和 刚才 的 实现 有 些 不 同 。 标 准 的 shell 在 读 到 fi 后 ,整个 
地 执行 让 语 名 块 。 这 是 怎么 做 到 的 昵 ? 为 什么 要 这 么 做 呢 ? 常用 的 shell ARARE B if 
博 句 ,这 里 的 程序 能 做 修改 以 支持 符 套 的 i£)? 


9.5 shell 变量 :局 部 和 全 局 


像 其 它 的 程序 语言 一 样 , Unix shell 也 有 变量 。 能 对 这 些 变量 赋值 ,也 可 从 这 些 变量 取 


值 , 列 出 所 有 变量 ,例如 以 下 的 代码 : 


S age= 7 

$ echo S age 

7 

$ echo age 

age 

$ echo $ age * $ age 

747 

$ read name 

fido | 

$ echo hello, $ name, how are you 
| hello, fido, how are you 

S ls > $ name.$ age 

$ food = muffins 

food:not found 


$ 


f assigning a value 


# retrieving a value 


4 the $ is required 


# purely string operations 


+ input from stdin 


# can be interpolated 


# used as a part of a command 


# no spaces in assignment 
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shell 包括 两 类 变量 :局 部 变量 和 环境 变量 。 在 前 面 提 到 过 了 , 像 HOME 和 TZ 这 样 的 
变量 可 以 让 用 户 把 个 性 化 设置 传递 给 程序 ,这 些 变 量 的 作用 有 点 象 全 局 变量 ,它们 可 以 被 所 
有 shell 的 子 进程 存 取 。 本 章 的 后 面 将 深入 了 解 环境 ,现在 ,只 要 记 住 有 两 类 变量 就 可 以 了 。 


9.5.1 使 用 shell 变量 
前 面 的 例子 演示 了 对 变量 的 大 部 分 操作 。 对 变量 的 操作 如 下 ， 








操作 类 型 语 法 +t NX 

赋值 var= value 不 能 有 空格 

引用 Svar 

删除 unset var 

输入 | read var 也 可 以 read varl var2. .. 
列 出 变量 set 

全 局 化 = export var 





变量 名 是 字符 A-—Z.a-—z.0—9 和 _ 的 组 合 。 第 一 个 字母 不 能 是 数字 。 变 量 名 是 大 小 写 
敏感 的 。 | 

变量 的 值 是 字符 串 。 变 量 都 是 字符 串 类 型 的 ,没有 数值 类 型 的 变量 。 所 有 的 操作 都 是 
字符 串 操作 。 

列 出 所 有 变量 使 用 set 命令 。set 命令 列 出 当前 shell 定义 的 所 有 变量 ,例如 : 


S set 

BASH = /bin/bash 

BASH VERSION = 1. 14. 7(1) 
DISPLAY - :0.0 

EUID = 500 

HOME = /home2 /bruce 
HOSTTYPE = 1386 

IFS- 


LANG = en 

LANGUAGE - en 

LD LIBRARY PATH = /usr/lib:/usr/local/lib 

LOGNAME - bruce 

OPTERR = 1 

OPTIND = 1 

OSTYPE = Linux 

PATH = /bin;/usr/bin;/usr/X11R6/bin;:/usr/local/bin : / home2 /bruce/bin 
PPID = 30928 | | 
PS4 = + 

PWD = /home2/bruce/projs/ubook/src/ch09 

SHELL = /bin/bash 





« 280 。 Unix/Linux 编程 实践 教程 


SHLVL = 2 

TERM = xterm color 
UID = 500 

USER = bruce 

_ = /bin/vi 

age = 7 


name = fido 
这 个 列表 中 包括 很 多 在 登录 时 设置 的 变量 ,加 上 两 个 后 面 新 增 的 局 部 变量 。 
9.5.2 变量 的 存储 


要 在 shell 里 增加 变量 ,必须 有 个 地 方 能 存放 这 些 变量 的 名 称 和 值 ,而 且 这 个 变量 存储 系 
统 必 须 能 够 分 辨 局 部 和 全 局 变量 。 下 面 是 这 个 存储 系统 的 抽象 模型 : 


(1) 模型 
变量 | fà 是 否 为 全 局 变量 ? 
data "phonebook. dat" | n. 
HOME "/home2 / fido" y 
TERM "t1061" y 





(2) 接口 (部 分 ) 

VLstore(char x var,char x val) 增加 /更 新 var— val 

VLookup(char * var) 取得 var 的 值 

VList 输出 列表 到 stdout 

(3) 实现 | 

可 以 用 链表 、hash 表 、 树 或 者 是 几乎 任何 数据 结构 来 实现 它 。 作 为 第 一 个 版 本 ,用 一 个 
结构 数组 ,其 中 的 每 个 变量 是 这 样 的 结构 ， 


struct var{ 


char x str; /*name 7 val stringx/ 


vartab 


int global; /*a booleanx/ 
b; 
static struct var tab[ MAXVARS |; 







如 图 9. 4 所 示 。 


9.5.3 增加 变量 命令 : Built-ins 


已 经 有 地 方 存放 变量 了 ,但 还 要 增加 给 变 图 9.4 shell 变量 的 存储 方式 
量 赋值 . 列 出 所 有 变量 和 获取 变量 值 的 命令 。 | | 


— TERM = xterm 
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> set 
->echo $ TERM 


set Æ shell 的 一 个 命令 ,而 不 是 一 个 由 shell 3x 77 WY EFF OER if 和 then KH RBH 
由 shell 自己 处 理 一 样 。 为 了 将 set 与 要 被 执行 的 程序 区 分 开 , 将 set RE AA B (built — in) 
的 命令 。 

命令 varname= value 告诉 shell 在 变量 表 里 添 加 一 项 ,赋值 语句 也 是 内 置 的 命令 。 

为 了 增加 内 置 的 命令 到 这 个 shell 中 ,需要 对 流程 图 做 另外 的 一 些 修 改 。 在 调用 fork 和 
exec 之 前 必须 先 看 看 命令 是 否 是 shell 内 置 的 命令 ,如 图 9. 5 Bron. 


smsh3 
ignore signals 
F 一 一 一 get command —— ~» exit 
| split line 
| y 
-- — — control command? 
| n 
| 一 builtin 二 一 
| do built-in 「 一 fork ~ 一 一 
| l 
l 一 一 wait enable signals 
| | execvp 
Lo — — — LI | exit 





B] 9.5 向 smsh 中 添加 内 置 命令 


修改 process 函数 ,使 之 在 调用 fork/exec 之 前 检查 是 否 为 内 荃 的 命令 : 


if C args[0] == NULL ) 
rv = 0; 
else if ( is control command(args|O0 ]) ) 
rv = do control command(args); 
else if ( ok to execute() )( 
if ( |! builtin command(args,&rv) ) 
rv = execute(args); 


} 


新 的 函数 builtin command 将 检查 和 执行 内 置 命令 合并 在 一 起 。 变 量 rv 用 来 标识 状 
态 ,builtin_command 返回 一 个 布尔 值 , 并 修改 状态 变量 rv. 
builtin. c 的 代码 如 下 : 


/x builtin.c 
* contains the switch and the functions for builtin commands 


*/ 








282 * 


# include 
i include 
it include 
# include 
+ include 
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<< stdio. h> 
«string. h> 
<ctype. h> 
"smsh. h" 


"varlib.h" 


int assign(char x); 


int okname(char x); 


int builtin command(char ** args, int x resultp) 


/* 


* purpose; run a builtin command 


* returns; 1 if args[0] is builtin, 0 if not 


* details; test args| 0] against all known built ~ ins. Call functions 


x/ 
| 


int rv 


= 0- 


F 


if ( stremp(args[0], "set") == 0 ){ /* 'set' command? x/ 
VLlistO; 


* resultp = 0; 


f 


else if ( strchr(args[0], := ') ! = NULL ){ /x assignment cmd x/ 


x resultp = assign(args|0]); 


if ( * resultp |= -1 ) 


} 


/* x- y=123 not ok x/ 


else if ( stremp(args[0], "export") == 0 ){ 
if ( args[1] != NULL && okname(args{ 1 |) ) 


x resultp = VLexport(args[1]); 


else 


* resultp = 1; 


f 


return rv; 


int assign(char * str) 


p 


* purpose; execute name - val AND ensure that name is legal 


x returns; —1 for illegal lval, or result of VLstore 


* warning: modifies the string, but retores it to normal 


*/ 


char 


* Cp; 
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int rv; 


cp = strchr(str,'- '); 
*cp = '\0'; 
rv = ( okname(str) ? VLstore(str,cp+1):-1); 
*cp = '= 4; 
return rv; 
} 
int okname(char x str) 
/* 
* purpose; determines if a string is a legal variable name 
* returns; 0 for no, 1 for yes 
*/ 
( 
char *cp; 


for(cp = str; *cp; cp== ){ 


if ( (isdigit( * cp) && cp== str) || | (isalnum( * cp) || xcp==，，)) 
return 0; 

j 

return (cp != str ) ;/* no empty strings, either x/ 


9.5.4 SRM 
编译 并 运行 改进 后 的 程序 : 


$ cc -o smsh3.c smsh2.c splitline.c execute.c process2.c \ 
controlflow.c builtin.c varlib.c 
$ ./smsh3 
> set 
> day = monday 
> temp = 75 
—TZ = CST6CDT 
L—x.y-z 
cannot execute command :No such file or directory 
> set | 
day = monday 
temp = 75 | 
TZ = CST6CDT 
> date 
Tue Jul 31 11:56:59 EDT 2001 
> echo $ temp, $ day 
$ temp, $ day 


n ———— — o 
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(1) 已 经 可 以 正常 工作 了 

这 里 的 shell 现在 支持 变量 了 ,能 够 给 变量 赋值 ， 也 可 以 列 出 当前 的 变量 ,程序 甚至 会 检 
查 不 合法 的 变量 名 ,不 会 将 这 些 名 字 作 为 程序 名 来 处 理 。 

(2) TZ 没有 传 给 Date 

从 这 里 的 例子 看 出 还 有 两 件 事 要 做 。 先 将 变量 TZ 的 值 设 为 美国 中 部 时 间 (U.S. 
central time) ,但 是 date 命令 报告 的 还 是 美国 东部 时 间 。 前 面 说 过 ,变量 TZ 是 程序 运行 环 
境 的 一 部 分 , 它 的 值 应 该 从 父 进 程 传 给 子 进程 ,这 如 何 才能 实现 呢 ?” 这 里 的 shell 如 何 才能 把 
变量 放 到 环境 中 使 它 的 子 进程 能 够 访问 得 到 ? 所 以 , 接 下 来 将 讨论 环境 。 
(3) 变量 $ temp fils day 的 值 没 有 被 正确 显示 

刚才 的 测试 表明 这 两 个 变量 的 值 没有 被 shell 正确 显示 ,也 就 是 说 , 当 shell 在 处 理 echo 
$ temp, $ day 时 没有 用 变量 的 值 奉 换 变 量 名 。 这 些 变量 是 shell 的 局 部 变量 ,echo 命令 不 
知道 这 些 变 量 的 值 ,所 以 shell 在 执行 外 部 程序 之 前 必须 进行 变量 替换 。 本 章 的 末尾 将 会 再 
探究 这 个 问题 。 


9.6 环境 :个 性 化 设置 


人 们 喜欢 按照 自己 的 喜好 设置 自己 的 电脑 ， 有 些 人 部 欢 用 风景 画作 桌面 ,而 其 他 一 些 人 
可 能 更 喜欢 纯色 的 桌面 ,有 些 人 喜欢 用 emacs 来 编辑 文本 ,而 有 些 人 喜欢 vi。Unix 允许 用 户 
在 称 之 为 环境 (environment) 的 地 方 以 变量 的 形式 存放 这 些 设置 。 每 个 用 户 有 一 个 惟一 的 主 
目录 ,用户 名 .邮件 文件 .终端 类 型 和 喜欢 用 的 编辑 器 ,很 多 个 性 化 的 设置 由 环境 中 的 变量 
记录 。 

很 多 程序 的 行为 基于 这 些 设置 ,比如 ,运行 script3, 可 以 看 到 date 根据 TZ 值 的 不 同 显 
AR AR I] BL EE 


#1 /bin/sh 
4 script3 — shows how an environment variable is passed to commands 
it TZ is time zone, affect things like date, and ls - 1 
# 
echo "The time in Boston is" 
TZ = ESTSEDT 
export TZ # add TZ to the environment 
date # date uses the value in TZ 
echo "The time in Chicago is" 
TZ = CST6CDT 
date 
echo "The time in LA is" 
TZ = PST8PDT 
date 


环境 不 是 shell 的 一 部 分 。 但 是 shell 包括 一 些 可 以 让 用 户 读 取 和 修改 环境 的 命令 。 一 
如 既往 , 先 崔 瞧 环境 做 些 什么 ,然后 学 习 它 是 如 何 工 作 的 ,最 后 把 它 加 到 实现 的 代码 中 。 
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9.6.1 使 用 环境 


1. 列 出 环境 
env 命令 列 出 当前 所 有 环境 设置 : 


S env 

LOGNAME - bruce 

LD LIBRARY PATH= /usr/lib:/usr/local/lib 

TERM = xterm — color | 

HOSTTYPE - 1386 

PATH = /bin:/usr/bin:/usr/X11R6/bin:/usr/local/bin:/home2/bruce/bin 

HOME = /home2 /bruce | 
J SHELL = /bin/bash 

USER = bruce 

LANGUAGE - en 

DISPLAY = :0.0 

LANG = en 

_ = /usr/bin/env 


SHLVL = 2 


env 是 一 个 普通 的 程序 ,而 不 是 shell 内 置 的 命令 。 这 里 列 出 设置 的 值 被 很 多 程序 所 使 
用 ,比如 ,LANG 变量 被 要 显示 信息 或 消息 的 程序 使 用 ,一 个 浏览 器 可 以 用 这 个 变量 的 值 来 
决定 按钮 的 标识 和 菜单 的 选项 ,DISPLAY 告诉 X Windows ABE STE BI 口 , TERM 告诉 
cursesC GUI 函数 库 ) 使 用 哪 一 组 屏幕 控制 代码 。 

2. 更 新 环境 

(1) var- value 

BEEE A ERIRE. HUI, SOF SCT IM ASR ST DL 
过 设置 LANG=fr 来 启用 法 语 。 

(2) export var 

使 用 shell 内 置 的 命令 export 向 环境 添加 新 的 变量 。 如 果 var 是 一 个 局 部 变量 ,那么 它 
将 被 添加 到 环境 里 。 如 果 Var 不 存在 ,shell 会 创建 一 个 。bash 允许 通过 用 export var 一 
value 将 创建 和 输出 合并 为 一 步 。 

3. 在 C 程序 中 读 入 环境 

使 用 标准 的 C FEES getenv 也 可 以 得 到 环境 变量 的 值 ,比如 : 


+ include «stdlib. h> 
main() 
{ 
Char *cp = getenv("LANG") ， 
if (cp ! = NULL && stremp(cp , "fr") == 0) 
printf("Bonjour\n") ; 


else 
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printf("Hello\n") ; 


9.6.2 什么 是 环境 以 及 它 是 如 何 工作 的 


环境 是 每 个 程序 都 可 以 存 取 的 一 个 字符 串 数组 ,如 图 9. 6 所 示 。 每 个 数组 中 的 字符 串 都 
以 var= value 这 样 的 形式 出 现 , 数 组 的 地 址 被 存放 在 一 个 名 为 environ 的 全 局 变量 里 。 环 境 
就 是 environ 指向 的 字符 串 数组 , 读 环境 就 是 读 这 个 字符 串 数组 ,改变 环境 就 是 改变 字符 串 、 
改变 这 个 数组 中 的 指针 或 者 将 这 个 全 局 指针 指向 其 他 数组 。 


environ 










TERM=vt100 


TZ=ESTSEDT 


PATH=/bin:/usr/bin 


HOME=/users/bub 









图 9.6 环境 是 一 个 指向 字符 串 的 指针 数组 


1. 一 个 简单 的 例子 
showenv. c 的 功能 就 像 命 令 env: 


/x showenv.c - shows how to read and print the environment 


*/ 
extern char ` ** environ; /* points to the array of strings x/^ 


main() 


{ 


int i; 


D 


) 


environ[i]); 


f 


for (i = 0; environ[i] ; i= 
printf(" % s\n" 


, 


} 


changeenv. c 改变 环境 ,然后 运行 env: 


/* changeenv. c — shows how to change the environment 


x note: calls "env" to display its new settings 
x/ 
it include- stdio. h> 


extern char ** environ; 
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main() 
{ 
char * table[ 3]; 


table[0] = "TERM = vt100"; /x fill the table x/ 
table[1] = "HOME = /on/the/range"; 
table[ 2 | nd 0; 
environ - table; /* point to that table x/ 
execlp("env", "env", NULL); /* exec a program x/ 
} 
下 面 是 示例 : 
5 ./changeenv 
TERM - vt100 
HOME 7 /on/the/range 
$ 


仔细 看 看 程序 。 在 程序 changeenv 中 创建 一 个 字符 串 列表 ,然后 调用 execlp 来 运行 另 一 
个 程序 env。 第 二 个 程序 能 够 读 到 这 个 字符 串 列表 ,也 就 是 说 通过 某 些 方法 ,将 这 个 数组 从 
第 一 个 程序 空间 复制 到 第 二 个 程序 空间 了 。 

2. 但 是 exec 清除 了 所 有 的 数据 ! 

在 讨论 exec 系统 调用 时 候 知道 ,对 它 的 调用 就 像 换 脑 ,用 目标 程序 的 代码 和 数据 替换 调 
用 程序 的 代码 和 数据 。 但 是 environ 指针 指向 的 数组 是 惟一 的 例外 , 当 内 核 执 行 系统 调用 
execve 时 , 它 将 数组 和 字符 串 复 制 到 新 的 程序 的 数据 空间 ,如 图 9. 7 所 示 。 


environ 






子 进程 和 父 进程 有 | 
相同 的 代码 ， 数 据 


和 environ 。 n 


exec 载 入 新 的 代码 
和 数据 到 进程 。 


图 9.7 environ 指向 的 数据 在 执行 exec() 时 被 复制 


在 生成 子 进程 的 过 程 中 ,观察 environ 数组 的 变化 。 可 以 看 到 ,fork 完整 地 复制 父 进程 ， 
包括 代码 和 数据 ,数据 中 包括 了 环境 。exec 清除 原来 进程 中 的 所 有 代码 和 数据 ,插入 新 程序 
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的 代码 和 数据 。 只 有 通过 参数 execvp 传递 的 数据 和 存储 在 环境 中 的 字符 串 可 以 从 旧 程 序 复 
制 到 新 程序 。 

3. 子 进 程 不 能 修改 父 进程 的 环境 

子 程序 中 环境 的 设置 是 父 进程 环境 的 复 本 , 子 进程 不 能 修改 父 进程 的 环境 。 因 为 在 进 
程 调用 fork 和 exec 时 整个 环境 都 被 自 动 的 复制 了 ,所 以 通过 环境 来 传递 数据 比较 方便 、 
快捷 。 


9.6.3 在 smsh 中 增加 环境 处 理 


现在 可 以 修改 shell 程序 使 其 能 够 存 取 环境 变量 。 首 先 ,shell 要 将 环境 中 的 变量 添加 到 
自己 的 变量 列表 里 。 然 后 ,shell 的 用 户 要 能 够 修改 和 添加 环境 变量 。 

l. 存 取 环境 变量 

已 经 知道 环境 的 结构 ,而 且 还 有 一 组 函数 向 变量 列表 添加 变量 。 当 shell 开始 运行 的 时 
候 , 环 境 中 的 变量 将 被 复制 到 自己 的 变量 列表 里 ,如 图 9.8 所 示 。 一 旦 这 些 值 被 复制 到 变量 
列表 里 ,就 能 用 set 命令 和 赋值 命令 来 查看 和 修改 这 些 变量 了 。 


environ 





VLenviron2table 
从 环境 复制 字符 串 
到 she11 的 变量 列表 





TERM=vt 100 
TZ-ESTSEDT 
PATH-/bin: /usr /bin 






图 9.8 从 环境 复制 值 到 vartab 


2. 改变 环境 

对 smsh3 的 测试 显示 了 对 TZ 的 改动 并 没有 传 给 date, 现在 知道 如 何 修改 环境 变量 了 。 
修改 环境 最 简单 的 方法 是 构建 一 个 全 新 的 列表 ,这 个 列表 包含 了 shell 中 的 所 有 变量 。 然 后 
将 全 局 指针 environ 指向 这 个 列表 ,如 图 9.9 所 示 。 调 用 exec, 内 核 将 这 些 设置 复制 到 新 的 
程序 中 。 注 意 , 现 在 没有 被 引用 的 环境 列表 中 依旧 存储 着 原来 的 值 ， 

3. 对 smsh 的 修改 

在 程序 流程 中 添加 两 步 , 如 图 9.10 所 示 。 这 两 步 通过 添加 两 行 代 码 来 实现 ， 
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vartab 





图 9.9 将 值 从 vartab 复制 到 新 的 环境 


(1) smsh4. c 中 的 setup 


void setup() 

[x 
* purpose: initialize shell 
* returns: nothing. calls fatal() if trouble 
x/ 

{ 


extern char x* environ; 


VLenviron2table(environ); 
signal(SIGINT, SIG IGN); 
signal(SIGQUIT, SIG_IGN); 


(2) execute2, c 中 的 execute: 


if ( (pid = fork()) == -1) 

perror("fork") ; 
else if ( pid == 0 ){ 

environ = VLtable2environ() ;/* new line x/ 
signal(SIGINT, SIG DFL); 
signal(SIGQUIT, SIG DFL); 
execvp(argv[0], arqv); 
perror( "cannot execute command"); 


exit(1) ; 












TERN=xterm 
TZ=PST8PDT 
PATH= / bin: / sbin 


VLtable2environ 


将 标记 为 输出 的 
shell Fi 
到 新 建 的 字符 串 
数组 中 
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smsh4 
igmore signals 
env2tab 
[^77 — > get command —— -»exit 
| split line 
y | 
|e -一 — control command? 
| n 
n 
| m— built-in? — ~ 
| do built-in [— fork — m 
= 一 — wait tab2env 
| enable signals 
| | execvp 
L — — — — — — exit 





图 9. 10 在 smsh 中 增加 环境 处 理 
4. 测试 改动 后 的 程序 


$ make smsh4 

cc — o smsh4 smshá.c splitline.c execute2.c process2.c \ 
controlflow.c builtin.c varlib.c 

$ ./smsh4 

— date 

Tue Jul 31 09:51:03 EDT 2001 

_> TZ = PST8PDT 

export TZ 

> date 

Tue Jul 31 06:51:30 PDT 2001 

> 


用 户 可 以 修改 和 增加 环境 变量 ,而 且 shell 也 会 把 这 些 新 的 值 传 给 它 运行 的 任何 程序 了 。 
9.6.4 varlib. c 的 代码 


/* varlib.c 
* 
* a simple storage system to store name - value pairs 
* with facility to mark items as part of the environment 
* 


* interface: 


六 


VLstore( name, value ) returns 1 for Ok, 0 for no 
x VLlookup( name ) returns string or NULL if not there 
x VLlist() prints out current table 
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x environment — related functions 

* VLexport( name ) adds name to list of env vars 
x VLtable2environ() copy from table to environ 

x VLenviron2table() copy from environ to table 


x details: 

x the table is stored as an array of structs that 

* contain a flag for global and a single string of 

< the form name = value. This allows EZ addition to the 
* environment. It makes searching pretty easy, as 


* long as you search for "name=" 


x*/ 


# include <stdio.h> 
# include <«<stdlib. h> 
# include  "varlib.h" 


# include <string. h> 
# define MAXVARS 200 /* a linked list would be nicer */ 


struct var ( 


char * str; /* name = val stringx/ 
int global; /* a booleanx/ 
^; 
static struct var tab| MAXVARS ]; /* the tablex/ 


char *);/* private methodsx / 
int) ; 


Static char x new string( char x 


f 


static struct var x find item(char x 


F 


int VLstore( char * name, char * val) 
/x 
* traverse list, if found, replace it, else add at end 
* since there is no delete, a blank one is a free one 
* return 1 if trouble, 0 if ok (like a command) 
*/ 
1 
struct var * itemp; 
char »*8; 


int rv = 1 


/* find spot to put it and make new string */ 
if ((itemp- find item(name,1))! = NULL && 
(s = new string(name,val))! = NULL) 


if ( itemp- >str ) /* has a val? x/ 
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free(itemp 一 str); /x y: remove it x/ 
itemp—>str = s; 


rv = 0. /x ok! «/ 


return rv; 


char * new string( char x name, char * val) 


/* 
* returns new string of form name - value or NULL on error 
x/ 
char * retval; 


retval = malloc( strlen(name) + strlen(val) + 2); 
if ( retval 1= NULL ) 
sprintt(retval, "%s= &s", name, val ); 


return retval; 


' char * VLlookup( char x name ) 

/* 
* returns value of var or empty string if not there 
#/ 

( 


struct var x itemp; 


if ( (itemp = find item(name,0)) ! = NULL ) 
return itemp- >str + 1 + strlen(name); 


return "". 


int VLexport( char * name ) 
/* 
* marks a var for export, adds it if not there 
* returns 1 for no, 0 for ok 
x/ 
1 
struct var * itemp; 


int rv = 1; 


if ( (itemp = find item(name,0)) ! = NULL ){ 
itemp - —global = 1; 


f 


else if ( VLstore(name, "") == 1) 








第 9 章 可 编程 的 shell、shell 变量 和 环境 :编写 自己 的 shell e 293 ° 
OA 人 -一 一 
rv = VLexport(name); 
return rv; 


} 


static struct var « find item( char x name , int first blank ) 
/* 
x searches table for an item 
x returns ptr to struct or NULL if not found 
x OR if (first blank) then ptr to first blank one 
t 
int i; 
int len = strlen(name); 


char *S; 


for( i = 0 ; i«MAXVARS && tabli].str != NULL; i++ ) 
{ 

s = tabli].str; 

if ( strncmp(s,name,len) == 0 &&s[len] == '=" ){ 


return &tab|ij; 


} 

if ( i < MAXVARS && first blank ) 
return &tab[i]; 

return NULL; 


void VLlist() 
/* 
x performs the shells set command 
* Lists the contents of the variable table, marking each 
x exported variable with the symbol ' x ' 
*/ 
{ 
int 1; 
for(i = 0 ; i<CMAXVARS && tab[ ij.str ! » NULL ; i++ ) 
( 
if ( tab[i].global ) 
printf(" x %s\n", tab[ il.str); 
else | 


printf(" % s\n", tab[il.str); 


j 


int VLenviron2table(char x env| D 
/x 
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* initialize the variable table by loading array of strings 
* return 1 for ok, 0 for not ok 
x/ 
{ 
int i; 


char * newstring; 


for(i = 0; env[ i] != NULL; i== ) 
( 
if ( 1 == MAXVARS ) 
return 0; 
newstring = malloc(1 t strlen(env[i])); 
. if ( newstring == NULL ) 
i return 0; 
strcpy(newstring, env[i]); 
tab|i].str = newstring; 
tab[i].global = 1; 
} 


while( i «C MAXVARS ){ /* I know we dort need this «x/ 
; tab[i].str = NULL ; /* static globals are nulled x/ 
tabLi== ].global = 0; /x by default x/ 
j 
return 1; 


char *x VLtable2environ() 
/* 
* build an array of pointers suitable for making a new environment 


* note, you need to free() this when done to avoid memory leaks 


*/ 
{ 
int i, /* index x/ 
j, /* another index x/ 
n= 0; /* counter x/ 
char . ** envtab; /* array of pointers x/ 
/* 
* first, count the number of global variables 
x/ 


for( i = 0 ; i<CMAXVARS && tab[i].str ! = NULL ; i++ ) 
if ( tab[ i]. global == 1) 


/* then, allocate space for that many variables */ 
envtab = (char **) malloc( (n+1) x sizeof(char x) ); 
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if ( envtab == NULL ) 
return NULL; 


/* then, load the array with pointers x/ 
for(i = 0, j = 0 ; i-CMAXVARS && tabl i]. str |= NULL; i++ ) 
if ( tab[i].global == 1) 
envtab| j++] = tab[i].str; 
envtab[j] = NULL; 


return envtab; 


9.7 已 实现 的 shell 的 功能 


在 本 章 中 ,学 习 了 Unix shell 的 可 编程 特征 ,还 在 实现 的 shell 中 增加 了 3 个 重要 的 功 
能 :命令 行 解析 Vif. . then 语句 和 变量 ,使 这 个 小 小 的 shell 成 长 迅速 。 下 面 是 shell 目前 的 特 
征 列表 : 7 











特征 是 否 支 持 有 待 改进 
命令 运行 程序 
变量 — ,set read, Svar 替换 
if if. . then else 
environ 全 部 
exit exit 
cd cd 
(1) 变量 替换 


增加 变量 替换 还 需 进 一 步 研究 。 在 流程 中 的 哪 一 步 将 $ X 替换 为 X 的 值 ? 注意 下 面 的 
例子 : 


S read x 

who am 1 

$ $x 

mori.xyz.com! nobody ttyl Dec 31 13:56 
$ grep $x /etc/passwd 

grep; am: No such file or directory 

grep: i: No such file or directory 


$ 


能 够 从 这 些 输出 中 得 出 哪些 关于 shell 的 分 析 阶 段 和 变量 替换 阶段 之 间 关 系 的 信息 ? 这 
样 的 设计 有 什么 好 处 吗 ? 能 在 这 里 的 程序 中 添加 这 一 特性 吗 ? 
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(2) 输入 /输出 重 定 回 
shell 允许 用 户 将 进程 的 输入 和 输出 重 定向 到 文件 或 者 其 他 进程 。 这 是 如 何 做 到 的 呢 ? 
能 够 在 这 里 的 shell 中 增加 这 一 特征 吗 ? 将 在 下 一 章 中 学 习 输 入 /输出 重 定向 。 


小 OK 


1 主要 内 容 

Unix shell 运行 一 种 称 为 脚本 的 程序 。 一 个 shell 脚本 可 以 运行 程序 .接受 用 户 输入 、 

使 用 变量 和 使 用 复杂 的 控制 逻辑 。 

if.. then 语句 依赖 于 下 述 惯例 :Unix 程序 返回 0 以 表示 成 功 。shell 使 用 wait 来 得 到 

程序 的 退出 状态 。 

shell 编程 语言 包括 变量 。 这 些 变量 存储 字符 串 , 它 们 可 以 在 任何 命令 中 使 用 。shell 

变量 是 脚本 的 局 部 变量 。 | 

每 个 程序 都 从 调用 它 的 进程 中 继承 一 个 字符 串 列表 ,这 个 列表 被 称 为 环境 。 环 境 用 

来 保存 会 话 (session) 的 全 局 设置 和 某 个 程序 的 参数 设置 ,shell 允许 用 户 查 看 和 修改 

环境 。 

2. 下 一 步 做 什么 

将 学 习 输入 /输出 的 重 定向 。 

3. 习题 

9.1 编写 名 为 set 的 一 个 C 程序 或 脚本 , 试 着 用 已 经 实现 的 shell 来 运行 它们 。 会 有 什 
ARR? 写 一 个 名 为 no 一 dice 的 “程序 或 者 脚本 然后 试 着 执行 它 , 又 会 如 何 ?” 用 
同样 的 方法 试 试 名 为 test 的 程序 。 有 没有 办 法 运行 这 些 程序 呢 ? 


9.2 能 修改 process. c 和 controlflow. c 的 设计 使 之 支持 嵌 套 的 iE RIO? 这 就 是 说 ， 
它 能 处 理 以 下 形式 的 输入 吗 ? 
if cmdi 
then 
if cmd2 


then 
cmd3 
else 
cmd4 
fi 
else 
cmd5 
| fi 
BERKI VL REEE CUR BE ,而 不 是 像 这 里 所 显示 的 1 层 。 需 要 更 多 的 状态 变量 吗 ? 
需要 一 个 栈 来 保存 这 些 状态 变量 吗 ? 如 果 构 造 一 个 栈 ,用 递归 的 方法 来 解决 是 不 
是 合理 ? 
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varlib. c 中 的 函数 通过 创建 一 个 新 的 环境 数组 来 更 新 环境 。 为 什么 不 用 realloc 来 
再 整 原 来 环境 的 大 小 呢 ? | 


4. 编程 练习 


9.4 


修改 smshl.c 使 之 能 够 在 一 行 中 接受 多 个 命令 。 要 做 到 这 一 点 最 简单 的 方法 是 
修改 next. cmd 函数 ,注意 不 要 打印 多 余 的 提示 符 。 


修改 smshl. c 使 之 能 够 接受 带 可 选 参数 的 exit 命令 。 保 证 你 的 程序 拒绝 非 整 数 
的 参数 (比如 :exit left)。 原 来 的 流程 中 在 哪里 处 理 这 个 命令 ”需要 增加 新 的 节点 
到 原来 的 流程 中 去 吗 ? 


修改 process. c 使 之 能 支持 if 控制 语句 中 的 else 部 分 。 


ok to execute 曙 数 使 用 两 个 变量 来 记录 当前 的 区 域 和 状态 。 可 以 用 一 个 有 多 个 
值 的 变量 来 替代 原来 的 两 个 变量 。 考 虑 下 面 一 组 状态 ; 
NEUTRAL, IF SUCCEEDED, IF FAILED, SKIPPING THEN, DOING THEN, SKIPPING ELSE, DOING 
ELSE 


修改 controlflow. c 以 使 用 这 个 单 变量 的 系统 。 


修改 smshl.c 使 之 能 接受 & 命令 结束 符 。 以 这 个 符号 结束 的 命令 将 在 后 台 运 行 。 
需要 对 next_cmd 做 一 些 修改 。 


常规 的 shell Ef Bik Bl Rea fi CH RE fi dé final 的 缩写 ,而 是 反 过 来 的 if) 才 执行 整 
个 语句 块 。 男 一 个 完全 不 同 的 做 法 是 将 if 结构 中 的 所 有 语句 读 入 一 个 有 三 个 部 
分 的 绪 构 体 中 。 第 一 个 部 分 是 条 件 命令 ,第 二 个 部 分 是 then 区 域 ,最 后 是 else 区 
域 的 命令 。 

将 整个 块 读 人 内 存 后 ,就 能 开始 执行 条 件 命令 ,基于 它们 的 结果 ,执行 then 区 域 或 者 
else 区 域 。 写 一 个 采用 这 个 方案 的 smsh。 你 的 解 应 该 能 接受 骨 套 的 让 语句 。 


在 你 的 shell 中 添加 while 循环 。 为 了 增加 这 个 功能 ,需要 把 循环 体 读 人 内 存 , 小 
iL V TEES (memory leak), 


一 个 进程 有 很 多 属性 ,其 中 之 一 是 这 个 进程 的 当前 目录 。Unix 的 发 明 者 写 了 个 
程序 chdir, 还 有 其 他 一 些 标准 的 目录 程序 :pwd\ls .mv 等 。 这 些 程序 已 经 被 废 
弃 , 它 们 的 功能 直接 由 shell 来 实现 。chdir 应 用 程序 有 什么 问题 吗 ? 在 你 的 
shell 中 添加 cd 命令 。 


shell 支持 特殊 的 变量 来 表示 系统 设置 。 比 如 ,变量 ss 表示 shell 的 进程 ID, 而 
S? 表示 最 后 一 条 命令 的 退出 状态 值 。 在 你 的 程序 中 增加 这 些 变量 。 


在 标准 Unix shell 的 命令 行 中 ,可 以 将 引号 引起 来 的 部 分 作为 一 个 独立 的 参数 ， 
一 个 命令 像 vi "My Book Report" 包 含 两 个 命令 行 参数 。 使 你 的 shell 接受 引号 。 
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在 shell 的 哪 一 部 分 处 理 引 号 ? 考虑 命令 rm "filel. c;2"。 就 算 你 的 程序 将 分 号 
理解 为 命令 分 隔 符 ,这 个 表达 式 还 是 应 该 被 理解 为 一 条 有 两 个 参数 的 命令 。 


很 多 shell 允许 用 户 通 过 对 一 个 特定 的 变量 赋值 来 设置 命令 提示 符 , 在 你 的 shell 
中 增加 这 个 特征 。 在 自己 的 shell 中 定义 一 个 变量 来 表示 提示 符 。sh 和 bash 用 
变量 PS1, 而 csh 家 族 用 变量 prompt, 
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概念 与 技巧 

。 I/O 重 定 向 : 概念 与 原因 

。 标准 输入 、 输 出 和 标准 错误 的 定义 
。 重 定向 标准 LO 到 文件 

。 使 用 fork 来 为 其 他 程序 重 定向 

。 管道 (Pipe) 

。 创建 管道 后 调用 fork 

相关 的 系统 调用 与 函数 

* dup.dup2 

* pipe 


10.1 shell 编程 


下 面 这 组 命令 是 如 何 工作 的 ? 


ls > my. files 


who | sort>>userlist 


shell 是 如 何 告诉 程序 将 结果 输出 到 文件 而 不 是 屏幕 的 呢 ? shell 又 是 如 何 将 一 个 进程 
的 输出 流连 接 到 另 一 个 进程 的 输入 流 的 呢 ? ME A (standard input) 这 个 术语 是 什么 
意思 ? 

本 章 将 关注 进程 间 通 信和 的 一 种 特殊 形式 : 输入 /输出 重 定 向 和 管道 (1/O redirection and 
pipes)。 首 先 将 介绍 在 编写 .shell 脚本 时 1/0 重 定 向 和 管道 所 起 的 作用 。 然 后 ,本 章 将 介绍 
操作 系统 中 对 LO 重 定 向 的 支持 。 最 后 , 写 一 个 程序 来 改变 进程 的 输入 和 输出 流 。 
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10.2 一 个 shell 应 用 程序 : 监视 系统 用 户 


考虑 一 下 这 个 问题 : 你 的 许多 朋友 和 你 使 用 同一 个 Unix 系统 。 你 希望 编写 一 个 程序 ， 
当 其 他 用 户 登 录 系 统 或 注销 时 通知 你 。 这 样 你 就 可 以 了 解 朋友 们 的 活动 。 

可 以 写 一 个 使 用 utmp 文件 和 间隔 计数 器 的 C 程序 来 完成 任务 。 程 序 打开 utmp 文件 ， 
记录 下 用 户 列表 ,休眠 一 段 时 间 后 再 重新 扫描 此 文件 ,并 将 变化 报告 出 来 。 

__ 个 更 简单 的 办 法 就 是 写 一 个 shell 脚本 。Unix 中 有 一 个 列 出 当前 用 户 的 命令 : who. 
Unix 中 同样 包含 了 休眠 和 处 理 字符 串 列表 的 程序 。 下面 是 一 个 Unix 的 脚本 ,用 来 报告 所 有 
的 登录 和 注销 情况 。 


Logic shell code 
get list of users(call it prev) who | sort — prev 
while true while true ; do 
sleep sleep 60 
get list of users(call it curr) who | sort > curr 
compare lists echo "logged out, " 
in prev, not in curr — logout comm — 23 prev curr 


echo "logged in; " 


in curr, not in prev -> login comm — 13 prev curr 
make prev - curr mv curr prev 


repeat done 


此 脚本 使 用 了 Unix 系统 所 提供 的 7 个 工具 一 个 while 循环 和 L/O 重 定向 ,编写 这 个 程 
序 解决 了 问题 。 仔 细 看 一 下 这 些 程序 的 细节 ,以 及 它们 之 间 的 连接 。 ! 

脚本 中 的 第 一 行 建立 了 一 个 在 此 脚本 运行 时 已 登录 用 户 的 列表 ,并 按 用 户 名 进行 排序 。 
who 命令 输出 用 户 列表 ,而 sort 命令 将 列表 作为 输入 读 进 ,然后 输出 一 个 排 好 序 的 列表 。 

命令 who | sort > prev 告诉 shell 同时 执行 who 和 sort, 将 who 的 输出 直接 送 到 sort 
的 输入 ,如 图 10. 1 所 示 。who 命令 并 不 一 定 要 在 sort 命令 开始 读 取 和 排序 之 前 完成 对 
utmp 文件 的 分 析 。 这 两 个 进程 以 很 小 的 时 间 间 隔 为 单位 来 调度 ,它们 和 系统 中 的 其 他 进程 
一 起 分 享 CPU 时 间 。 然 后 ,sort > prev 告诉 shell 将 sort 的 输出 送 至 prev MHP. AMX 
件 不 存在 , 则 创建 此 文件 ; 若 已 经 存在 , 则 替换 其 内 容 。 


who | sort > file 





(EEE EO ERE 


图 10.1 将 who 的 输出 连结 到 sort 的 输入 
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在 休眠 一 分 钟 之 后 ,脚本 在 文件 curr 中 创建 了 一 个 新 的 用 户 列表 。 如 何 来 比较 两 个 排 
好 序 的 登录 记录 列表 呢 ? 使 用 Unix 的 工具 comm( 如 图 10. 2 所 示 ) ,可 以 找 出 两 个 文件 中 共 
有 的 行 。 比 较 两 个 文件 可 以 得 到 三 个 子 集 : 仅 文 件 1 有 的 行 , 仅 文 件 2 有 的 行 ,两 者 共有 的 
fT. comm 命令 比较 了 两 个 排 过 序 的 列表 ,并 将 此 三 列 打印 出 来 ,这 里 的 每 一 列 代表 一 个 子 
集 的 内 容 。 可 以 使 用 命令 行 选项 来 让 结果 只 出 现 其 中 的 任意 一 列 或 两 列 。 比 如 说 ,如 下 两 
个 命令 ， 

comm ~ 23 prev curr + HRB IAB =F =) Riba prev 中 的 内 容 

comm — 13 prev curr # EAS — Af =F =) 仪 显示 curr 中 的 内 容 


生成 所 需要 的 两 个 集合 : 前 一 个 列表 中 有 而 当前 列表 中 没有 的 登录 记录 (注销 的 用 户 ) ,以 及 
当前 列表 中 有 而 前 一 个 列表 中 没有 的 登录 记录 (新 登录 用 户 )。 


图 10.2 comm 比较 两 个 列表 ,输出 三 个 集合 


最 后 ,命令 mv curr prev 将 当前 列表 文件 curr 更 名 为 prev, 并 替换 原来 的 prev 文件 。 

watch. sh 脚本 体现 了 三 个 重要 的 思路 ， 

(1) shell 脚本 的 功能 一 一 与 C 相 比 简单 易 用 ; 

(2) 软件 工具 的 灵活 性 一 一 每 一 个 工具 完成 一 项 特定 的 .通用 的 功能 ; 

(3) 1/O 重 定向 和 管道 的 使 用 和 作用 。 | 

程序 watch. sh Jay Y dap fi Hj ^ — "BRE fESI TEL CUTE HUE SECURE Mg fg S EE. KV 
于 某 人 用 C 写 了 如 下 的 调用 : 


x = func a(func b(y)); /x 将 func b 的 结果 作为 func_a 的 输入 */ 
用 shell 写 ,就 是 ， | 

prog b | prog a > x $34 prog_b 的 结果 作为 prog a 的 输入 并 将 最 终结 果 放 入 x 

这 些 程序 如 何 工作 的 ? shell 在 进程 的 连接 中 起 什么 样 的 作用 呢 ? 内 核 起 什么 作用 ? A 
个 程序 又 起 什么 作用 ? 


10.3 标准 L/O 与 重 定向 的 若干 概念 


所 有 的 Unix I/O 重 定向 都 基于 标准 数据 流 的 原理 。 考 虑 一 下 sort 工具 是 如 何 工 作 的 。 
sort 从 一 个 数据 流 中 读 取 字 节 ,再 将 结果 输出 到 另 一 个 流 中 ,同时 若 有 错误 发 生 , 则 将 错误 报 
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0 


告 给 第 三 个 流 。 如 果 和 忽略 这 些 标准 流 的 去 向 问题 ,sort 工具 的 基本 原型 就 如 图 10. 3 Bra. 
三 个 数据 流 分 别 如 下 : 

。 标 准 输 入 一 一 需要 处 理 的 数据 流 

。 标准 输出 一 一 结果 数据 流 

。 标准 错误 输出 一 一 错误 消息 流 





10.3 sort 工具 将 输入 读 进 并 输出 结果 和 错误 消息 


10.3.1 概念 1: 3 个 标准 文件 描述 符 


所 有 的 Unix 工具 都 使 用 图 10. 3 中 所 示 的 三 种 流 的 模型 。 此 模型 通过 一 个 简单 的 规则 
来 实现 。 这 三 种 流 的 每 一 种 都 是 一 个 特别 的 文件 描述 符 , 其 细节 如 图 10.4 Bran. 








标准 文件 描述 符 


0: stdin 
1: stdout 
2: stderr 


ase 


图 10.4 3 个 特殊 的 文件 描述 符 


概念 : 所 有 的 Unix 工具 都 使 用 文件 描述 符 0、1 和 2。 
标准 输入 文件 的 描述 符 是 0, 标 准 输出 的 文件 描述 符 是 1, 而 标准 错误 输出 的 文件 描述 符 
则 是 2. Unix 假设 文件 描述 符 0、1、2 已 经 被 打开 ,可 以 分 别 进行 读 、 写 和 写 的 操作 了 。 


10.3.2 默认 的 连接 : tty 


通常 通过 shell 命令 行 运行 Unix 系统 工具 时 ,stdin stdout 和 stderr 连接 在 终端 上 。 因 
此 ,工具 从 键盘 读 取 数据 并 且 把 输出 和 错误 消息 写 到 屏幕 。 举 例 来 说 ,如 果 输 入 sort 并 按 下 
回 车 键 ; 终 端 将 会 被 连接 到 sort 工具 上 。 随 便 输 入 几 行 文字 , 当 按 Ctrl - D 键 来 结束 文字 输 
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和 的 时 候 ,sort 程序 对 输入 进行 排序 并 将 结果 写 到 stdout, 
大 部 分 的 Unix 工具 处 理 从 文件 或 标准 输入 读 人 的 数据 。 如 果 在 命令 行 上 给 出 了 文件 


名 ,工具 将 从 文件 读 取 数据 。 寿 无 文件 名 ,程序 则 从 标准 输入 读 取 数 据 。 


10.3.3 程序 都 输出 到 stdout 


从 为 一 方面 说 ,大 多 数 程 序 并 不 接收 输出 文件 名 ; 它们 总 是 将 结果 写 到 文件 描述 符 1, 并 
将 错误 消息 写 到 文件 描述 符 2 了?。 如 果 希 望 将 进程 的 输出 写 到 文件 或 男 一 个 进程 的 输入 去 ， 
就 必须 重 定向 相应 的 文件 描述 符 。 


10.3.4 重 定 向 IO 的 是 shell 而 不 是 程序 


通过 使 用 输出 重 定向 标志 ,命令 cmd filename 告诉 shell 将 文件 描述 符 1 定位 到 文件 。 
于 是 shell 就 将 文件 描述 符 与 指定 的 文件 连接 起 来 。 

程序 则 持续 不 断 地 将 数据 写 到 文件 描述 符 1 中 ,根本 没有 意识 到 数据 的 目的 地 已 经 改变 
了 。 下 面 的 程序 listargs. c 展示 了 程序 甚至 没有 看 到 命令 行 中 的 重 定向 符号 : 


/* listargs.c 


x print the number of command line args, list the args, 
x then print a message to stderr 
*/ 


# include <stdio. h> 

main( int ac, char x av[]) 

{ 
int i; 
printf("Number of args; $d, Args are; M", ac); 
for(i=0; i<ac; i++) 


printf("args[ $ d] % s\n", i, avLi]); 


fprintf(stderr, "This message is sent to stderr. Mn"); 


} 
程序 listargs 将 命令 行 参 数 打 印 到 标准 输出 。 注 意 listargs 并 没有 打印 出 重 定向 符号 和 
文件 名 。 


$ cc listargs.c - o listargs 
$ ./listargs testing one two 
args[0] ./listargs 

args[ 1 | testing 

args|2] one 

args| 3] two 


This message is sent to stderr. 


(D sort 和 dd 命令 允许 覆盖 stdout, 但 这 是 由 于 其 他 的 原因 ， 
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S ./listargs testing one two > xyz 
This message is sent to stder. 

$ cat xyz 

args[0 | ./listargs 

args[1] testing 

args| 2] one 

args| 3] two 

$ ./listargs testing —xyz one two 2> oops 
$ cat xyz 

args| 0] ./listargs 

args[1] testing 

args{ 2] one 

args| 3] two 

$ cat oops 


This message is sent to stderr. 


这 些 例子 验证 了 关于 shell 输出 重 定向 的 一 些 重要 概念 。 最 重要 的 一 点 是 shell 并 不 将 
重 定向 标记 和 文件 名 传递 给 程序 

第 二 个 概念 是 重 定 向 可 以 出 现在 命令 行 中 的 任何 地 方 ,并 且 在 重 定向 标识 符 周 围 并 不 
需要 空格 来 区 分 。 甚 至 一 个 像 listing ls 这 样 的 命令 也 是 可 以 接受 的 。 IX FE “AES HE 
不 能 终止 命令 和 参数 , 它 只 不 过 是 一 个 附加 的 请 求 而 已 。 

最 后 一 个 概念 是 许多 版 本 的 shell 都 提供 对 重 定 向 其 他 文件 描述 符 的 支持 。 例 如 ， 
2>filename 即 重 定 向 文件 描述 符 2 ,也 就 是 将 标准 错误 输出 到 给 定 的 文件 中 。 


10.3.5 理解 IO 重 定 向 


在 watch. sh 中 可 以 看 到 ,1/0O 重 定 向 是 Unix 程序 设计 中 一 个 重要 部 分 。 同 样 在 
listargs. c 中 看 到 ,是 shell, 而 非 程 序 将 输入 和 输出 重 定 向 的 。 

但 shell 是 如 何 重 定向 I/O 的 呢 ? 怎样 写 重 定 向 1/O 的 程序 呢 ? 本 章 的 工作 就 是 编写 
可 以 完成 三 个 基本 的 重 定向 操作 的 程序 : 


。 who userlist 将 stdout 连接 到 一 个 文件 
* sort< data 将 stdin 连接 到 一 个 文件 
* Who | sort 将 stdout 连接 到 stdin 


10.3.6 概念 2:“ 最 低 可 用 文件 描述 符 {(Lowest- Available- fd) " Ji IJ 


那么 什么 是 文件 描述 符 呢 ? 文件 描述 符 的 概念 非常 简单 : 它 是 一 个 数组 的 索引 号 。 每 
个 进程 都 有 其 打开 的 一 组 文件 。 这 些 打 开 的 文件 被 保持 在 一 个 数组 中 。 文 件 描述 符 即 为 某 
文件 在 此 数组 中 的 索引 。 图 10. 5 显示 了 “最 低 可 用 文件 描述 符 (Lowest- Available ^ fd)” 
原则 。 
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Unix 经 党 给 最 低 可 用 文件 描述 符 指定 新 连接 





10.5 最 低 可 用 文件 描述 符 原 则 


BUE: 当 打开 文件 时 ,为 此 文件 安排 的 描述 符 总 是 此 数组 中 最 低 可 用 位 置 的 索引 。 

通过 文件 描述 符 建 立 一 个 新 的 连接 就 像 在 一 条 多 路 电话 上 接收 一 个 连接 一 样 。 每 当 有 
用 户 拨 一 个 电话 号 码 , 内 部 电话 系统 为 这 个 拨号 请 求 益 配 一 条 内 部 的 线路 号 。 在 许多 这 样 
的 系统 上 ,下 一 NERS ees NN. 


10.3.7 两 个 概念 的 结合 


| 已 经 介绍 了 两 个 基本 的 概念 。 首 先 , Unix 进程 使 用 文件 描述 符 0、1、2 作为 标准 输入 . 输 

出 和 错误 的 通道 。 其 次 , 当 进程 请 求 一 个 新 的 文件 描述 符 的 时 候 ,系统 内 核 将 最 低 可 用 的 文 
件 描述 符 赋 给 它 。 将 这 两 个 概念 结合 在 一 起 ,大 家 就 可 以 理解 I/O 重 定向 是 如 何 工作 的 了 ， 
也 就 可 以 自己 写 出 程序 来 完成 1/O 的 重 定向 。 


10.4. 如何 将 stdin 定向 到 文件 


下 面 将 详细 地 考察 ,程序 如 何 将 标准 输入 重 定向 以 至 可 以 从 文件 中 读 取 数据 。 更 加 精 
确 一 点 说 ,进程 并 不 是 从 文件 读数 据 , 而 是 从 文件 描述 符 读数 据 。 如 果 将 文件 描述 符 0 定位 
到 一 个 文件 ,那么 此 文件 就 成 为 标准 输入 的 源 。 

下 面 将 考察 三 人 METH aE RI Gr TF, 但 使 
用 管道 的 时 候 , 这 些 方 法 都 是 必要 的 。 


10.4.1 方法 1: close then open 


第 一 种 方法 是 close- then -open 策略 。 这 种 技术 类 似 手 奎 断 电 话 释 放 一 条 线路 ,然后 
再 将 电话 擒 起 从 而 得 到 另 一 条 线路 。 尖 体 步骤 如 干 。 

开始 的 时 候 ,系统 中 采用 的 是 典型 的 设置 。 EC PER RMRRNNMEE IR. 
输入 的 数据 流 经 过 文件 描述 符 0 而 输出 的 流 经 过 文件 描述 符 1 和 2, 如 见 图 1016 Br. 

接 下 来 ,第 一 步 是 close(0) ,即将 标准 输入 的 连接 挂 断 。 这 里 调用 close(0) 将 标准 输入 
与 终端 设备 的 连接 切断 。 图 10. 7 中 显示 了 当前 文件 描述 符 数组 中 的 第 一 个 元 素 现在 处 在 空 
闲 状 态 。 
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图 10.6 典型 的 初始 化 配置 






调用 close (0) 之 后 


图 10.7 stdin 被 关闭 


最 后 ,使 用 open(filename,;O_RDONLY) 打 开 二 个 想 连 接 到 stdin 上 的 文件 。 当 前 的 最 


低 可 用 文件 描述 符 是 0, 因 此 所 打开 的 文件 将 被 连接 到 标准 输入 上 去 。 如 图 10. 8 所 示 ,任何 
从 标准 输入 读 取 数据 的 函数 都 将 从 此 文件 中 读 入 。 


N—— — 22 MM open Jon ks 


| | open 调用 创建 了 一 个 到 
EET HESS 文件 的 连接 ， 并 建立 指向 
T 最 低 可 能 表 项 的 指针 。 


图 10.8 stdin 现在 已 经 连接 到 文件 上 了 
下 面 的 程序 即使 用 close 一 then 一 open 方法 : 


*/ stdinredirl.c 


* purpose; show how to redirect standard input by replacing file 


x descriptor 0 with a connection to a file. 


* action; reads three lines from standard input, then 


* closes fd 0, opens a disk file, then reads in 
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* three more lines from standard input 
*/ 

# include <stdio. h> 

# include <fentl. h> 


main) 
( 
int fd ; 
char line{ 100]; 


/x read and print three lines x/ 


fgets( line, 100, stdin ); printf(" * s", line); 
fgets( line, 100, stdin ); printf("%s", line); 
fgets( line, 100, stdin ); printf(" * s", line ); 


/* redirect input x/ 


close(0); 

fd = open("/etc/passwd", O RDONLY); 

if ( fd !» 091 
fprintf(stderr, "Could not open data as fd 0\n"); 
exit(1); 

j 


/* read and print three lines x/ 


fgets( line, 100, stdin ); printf("$ s", line); 
fgets( line, 100, stdin ); printf("%s", line); 
fgets( line, 100, stdin ); printf("%s", line); 
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程序 stdinreaderl 从 标准 输入 读 取 并 打印 了 三 行 字 符 串 ,然后 重 定向 标准 输入 ,之 后 又 


从 标准 输入 中 读 取 并 打印 了 三 行 字 符 串 。stdinreaderl 从 键盘 读 取 了 
行 字符 串 则 是 从 passwd 文件 中 读 出 的 : 


$ ./stdinredirl 

linel 

linel 

testing line2 

testing line2 

line 3 here 

line 3 here 

root; x; 0; 0: root, /root: /bin/bash 
bin; x: 1; 1, bin; /bin, 

daemon; x; 2; 2; daemon, /sbin; 


$ 


ii. —— 4— 


HJ — fT 


字符 串 , 而 后 三 
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此 程序 并 没有 什么 特别 的 地 方 , 它 仅 仅 挂 断 电话 又 拨 了 一 个 新 的 号 码 而 已 。 当 连接 建 
立 起 来 后 ,就 可 以 从 标准 输入 的 一 个 新 的 源 接收 数据 了 。 


10.4.2 方法 2: open.. close. . dup. . close 


考虑 一 下 这 种 情况 : 电话 啊 了 ,你 拿 起 了 楼 上 的 分 机 ,但 你 意识 到 上 自己 应 该 下 楼 去 接 电 
话 。 于 是 你 让 楼 下 的 人 把 电话 扒 起 ,这 样 就 有 两 个 连接 ,然后 把 楼 上 的 分 机 挂 断 ,此 时 楼 下 
的 电话 是 惟一 的 连接 了 。 这 种 情况 大 家 是 不 是 很 熟悉 ?其 实 这 种 方法 的 思路 就 是 从 楼 上 的 
电话 复制 一 个 连接 到 楼 下 ,然后 就 可 以 在 不 断 线 的 情况 下 将 楼 上 的 连接 切断 。 

如 图 10.9 所 示 ,Unix 系统 调用 dup 建立 指向 已 经 存在 的 文件 描述 符 的 第 二 个 连接 。 这 
种 方法 需要 4 个 步骤 。 

(1) open(file) 

第 一 步 是 打开 stdin 将 要 重 定向 的 文件 。 这 个 调用 返回 一 个 文件 描述 符 , 这 个 描述 符 并 
不 是 0, 因 为 0 在 当前 已 经 被 打开 了 。 

(2) close(0) 

下 一 步 是 将 文件 描述 符 0 关闭 。 文 件 描述 符 0 现在 已 经 空闲 了 。 

(3) dup(fd) 

系统 调用 dup(fd) 将 文件 描述 符 fd 做 了 一 个 复制 。 此 次 复制 使 用 最 低 可 用 文件 描述 符 
号 。 因 此 ,获得 的 文件 描述 符 是 0。 这 样 ,就 将 磁盘 文件 与 文件 描述 符 0 连接 在 一 起 了 。 

(4) close(fd) 

最 后 ,使 用 close(fd) 来 关闭 文件 的 原始 连接 ,只 留 下 文件 描述 符 0 的 连接 。 将 这 种 方法 
与 把 电话 从 一 个 分 机 转移 到 另 一 个 分 机 的 技术 做 一 个 比较 。 


fd = open("f", O RDONLY); close(0); 





10.9 使 用 dup 重 定向 
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下 面 的 程序 stdinredir2. c 使 用 了 第 二 种 方法 : 


/* stdinredir2.c 
* shows two more methods for redirecting standard input 
* use # define to set one or the other 
x/ 

# include <stdio.h> 

# include < fentl. h> 


/* #define CLOSE DUP /* open, close, dup, close x/ 


/* dX define USE DUP2 /* open, dup2, close x/ 
main() 
( 

int fd ; 

int newfd; 


char line[100]; 
/* read and print three lines x/ 


fgets( line, 100, stdin ); printf("* s", line); 
fgets( line, 100, stdin ); printf(" $ s", line); 
fgets( line, 100, stdin ); printf(" * s", line ); 


/* redirect input x/ 


fd - open( "data", O RDONLY); /* open the disk file x/ 
# ifdef CLOSE DUP 

close(0); 

newfd = dup(fd); /* copy open fd to 0 x/ 
i else 

newfd = dup2(fd,0); /* close 0, dup fd to 0 */ 
# endif 


if ( newfd !- 0 ){ 
fprintf(stderr, "Could not duplicate fd to 0\n"); 
exit(1); | | 

f 

close(fd) ; /* close original fd x/ 


/* read and print three lines x/ 


fgets( line, 100, stdin ); printf("%s", line); 

fgets( line, 100, stdin ); printf("%s", line ); 

fgets( line, 100, stdin ); printf("%s", line); 
- 


介绍 上 面 提 到 的 这 个 包含 有 4 个 步骤 的 方法 的 主要 目的 是 为 了 让 大 家 了 解 dup 系统 调 
用 ,这 个 调用 在 后 面 学 习 管 道 的 时 候 是 非常 重要 的 。 一 个 简单 一 点 的 方案 是 将 close(0) 和 
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dup(fd) 结 合 在 一 起 作为 一 个 单独 的 系统 调用 dup2。 


10.4.3 系统 调用 dup 小 结 














dup. dup2 

目标 复制 一 个 文件 描述 符 
头 文件 # include <unistd, h> 
E A m newíd == dup(oldfd) ; 

newfd = dup2(oldfd,newfd) ; 
BR oldfd 需要 复制 的 文件 描述 符 

newíd 复制 oldfd 后 得 到 的 文件 描述 符 
返回 值 一 ] 发 生 错 误 

newld 新 的 文件 描述 符 


系统 调用 dup 复制 了 文件 描述 符 oldfd。 而 dup2 将 oldfd 文件 描述 符 复 制 给 newfd。 两 
个 文件 描述 符 都 指向 同一 个 打开 的 文件 。 这 两 个 调用 都 返回 新 的 文件 描述 符 , 若 发 生 错 误 ， 
则 返回 一 1。 


10.4.4 方法 3: open. . dup2. . close 


程序 stdinredir2. c 包含 了 条 件 编译 代码 #ifdef ,用 系统 调用 dup2(fd,0) 来 替换 close(0) 
和 dup(fd)。dup2(orig,new) 将 文件 描述 符 old 复制 到 文件 描述 符 new ,在 此 之 前 它 先 将 文 
件 描述 符 new 上 已 经 存在 的 连接 关闭 。 


10.4.5 shell 为 其 他 程序 重 定 向 stdin 


这 些 例子 显示 了 程序 如 何 将 标准 输入 重 定向 到 文件 。 实 际 上 ,如 果 程 序 希 望 读 取 文 件 ， 
它 直 接 打开 文件 就 可 以 了 ,根本 不 需要 将 标准 输入 重 定 向 到 文件 。 这 些 例 子 的 真正 意义 在 
于 说 明 一 个 程序 如 何 将 标准 输入 重 定向 到 别 的 程序 。 


10. 5 为 其 他 程序 重 定向 I/O: who > userlist 


当 某 用 户 输入 who userlist, shell 运行 who 程序 ,并 将 who 的 标准 输出 重 定向 到 名 为 
userlist 的 文件 上 。 这 是 如 何 完成 的 呢 ? 

关键 之 处 就 在 于 fork 和 exec 之 间 的 时 间 间 隙 。 在 fork 执行 之 后 , 子 进程 仍然 在 运行 
shell 程序 ,并 准备 执行 exec, exec 将 替换 进程 中 运行 的 程序 ,但 它 不 会 改变 进程 的 属性 和 进 
程 中 所 有 的 连接 。 也 就 是 说 ,在 运行 过 exec 之 后 ,进程 的 用 户 ID 不 会 改变 ,其 优先 级 不 会 改 
变 , 并 且 其 文件 描述 符 也 和 运行 exec 之 前 一 样 。 注 意 , 程 序 得 到 的 是 载 人 它 的 进程 所 打开 的 
文件 。 图 10. 10 展示 了 子 进程 的 输出 重 定向 。 
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子 进 程 继 承 了 父 进 程 指向 打开 
文件 的 指针 。 子 进程 重 定向 标 
准 输出 s 

closeC1) ; 

create( "f") 


exec() ; 





打开 被 子 进程 继承 的 文件 
被 子 进程 打开 文件 


图 10. 10 shell 为 子 进程 重 定向 其 输出 





看 一 下 如 何 使 用 这 个 原则 来 重 定 向 标准 输出 。 

l. 初始 情况 

如 图 10.11 所 示 ,进程 运行 在 用 户 空间 中 。 文 件 描述 符 1 连接 在 打开 的 文件 f{ 上。 为 了 
使 这 幅 图 清楚 易 理 解 , 其 他 打开 的 文件 并 未 画 出 来 。 





图 10. 11 在 调用 fork 之 间 的 进程 以 及 它 的 标准 输出 


2. 父 进程 调用 fork 之 后 

如 图 10.12 所 示 ,新 的 进程 出 现 了 。 此 进程 与 原始 进程 运行 相同 的 代码 ,但 它 知道 自己 
是 子 进程 。 此 进程 包含 了 与 父 进 程 相同 的 代码 \ 数 据 和 打开 文件 的 文件 描述 符 。 因 此 文件 
描述 符 1 依然 指向 的 是 文件 f。 然 后 子 进程 调用 了 close(1) 。 


父 进 程 





1 IDE 


图 10.12 ” 子 进 程 的 标准 输出 从 父 进程 那儿 继承 而 得 


3. 在 子 进程 调用 close(1) 之 后 
如 图 10. 13 所 示 , 父 进程 并 没有 调用 close(1) ,因此 父 进程 中 的 文件 描述 符 1 仍然 指向 
{。 了 于 进程 调用 close(1) 之 后 ,文件 描述 符 1 变 成 了 最 低 未 用 文件 描述 符 。 子 进程 现在 试 着 
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打开 文件 g。 


父 进程 子 进 程 





10.13 子 进程 可 以 关闭 其 标准 输出 


4. 在 子 进 程 调用 creat("g",m) 之 后 
如 图 10. 14 Pras ,文件 描述 符 1 被 连接 到 文件 g。 子 进程 的 标准 输出 被 重 定 癌 到 g. F 
进程 然后 调用 exec 来 运行 who。 





图 10.14 子 进 程 打开 一 个 新 的 文件 得 到 fd=1 


5. 在 子 进 程 使 用 exec 执行 新 程序 之 后 

如 图 10.15 所 示 , 子 进程 执行 了 who 程序 。 于 是 子 进程 中 的 代码 和 数据 都 被 who 程序 
的 代码 和 数据 所 替代 了 ,然而 文件 描述 符 被 保留 下 来 。 POETER E OTE 
是 数据 ,它们 属于 进程 的 属性 ,因此 exec 调用 并 不 改变 它们 。 
子 进程 
新 的 程序 


指向 打开 文件 的 指 
针 是 进程 的 一 部 分 ; 
但 此 数组 并 不 是 程 
序 中 的 数据 。 


父 进程 






图 10.15 子 进程 运行 程序 并 将 标准 输出 重 定 问 


who 命令 将 当前 用 户 列表 送 至 文件 描述 符 1。 其 实 这 组 字 节 已 经 被 写 到 文件 g PET, 
而 who 命令 却 毫 不 知晓 。 | 
下 面 的 程序 whotofile. c 展示 了 上 面 所 说 的 这 种 方法 : 
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/* whotofile.c 

* purpose; show how to redirect output for another program 

* idea; fork, then in the child, redirect output, then exec 
x/ 

# include 二 stdio. h> 


main() 

i 
int pid; 
int fd; 


F 


printf("About to run who into a file\n"); 


/* create a new process or quit x/ 

if( (pid = fork() ) == ~1){ 
perror("fork"); exit(1); 

} 

/* child does the work */ 

if (pid == 0 ){ 


close(1); /* close, x/ 
fd = creat( "userlist", 0644 ); /* then open x/ 
execlp( "who", "who", NULL ); /* and run x/ 


perror("execlp"); 

exit(1): 
j 
/* parent waits then reports x/ 
if ( pid != 0)1 

wait(NULL); 


printf("Done running who. results in userlist\n") ; 


重 定 同 到 文件 的 小 结 
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共有 三 个 基本 的 概念 ,利用 它们 使 得 Unix 下 的 程序 可 以 轻易 地 将 标准 输入 、 输 出 和 错 


误 信 息 输 出 连接 到 文件 : 
(1) 标准 输入 .输出 以 及 错误 输出 分 别 对 应 于 文件 描述 符 0.1.2; 
(2) 内 核 总 是 使 用 最 低 可 用 文件 描述 符 ; 
(3) 文件 描述 符 集 合 通过 exec 调用 传递 ,是 不 会 被 改变 。 


shell 使 用 进程 通过 fork 产生 子 进 程 与 子 进 程 调用 exec 之 间 的 时 间 间 隔 来 重 定向 标准 


输入 、 输 出 到 文件 。 
shell 同样 支持 下 面 几 种 形式 的 命令 ， 


who >> userlog 
sort « data 
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编写 可 以 支持 以 上 两 种 操作 的 代码 就 留 给 大 家 作为 练习 去 完成 。 


10.6 管道 编程 


现在 已 经 学 习 了 如 何 编写 程序 将 标准 输出 重 定向 到 文件 。 下 面 将 要 讨论 如 何 使 用 管道 
来 连接 一 个 进程 的 输出 和 另 一 个 进程 的 输入 。 图 10. 16 展示 了 管道 的 工作 原理 。 管 道 是 内 
核 中 的 一 个 单 向 的 数据 通道 。 管 道 有 一 个 读 取 端 和 一 个 写 人 端 。 实 现 who|sort 这 样 的 操 
TE ,需要 两 种 技巧 : 如 何 创 建 管道 ,以 及 如 何 将 标准 输入 和 输出 通过 管道 连接 起 来 。 





图 10. 16 两 个 进程 由 管道 连接 在 一 起 


10.6.1 创建 管道 
图 10.17 所 示 即 为 一 根 管道 。 可 以 使 用 如 下 的 系统 调用 来 创建 管道 。 














pipe 
目标 创建 管道 | 
头 文件 # include — unistd. h> 
函数 原型 result = pipe(int array[ 2 ]) ; 
参数 array 包含 两 个 int 类 型 数据 的 数组 
—1 发 生 错 误 


返回 值 





图 10. 17 管道 


调用 pipe 来 创建 管道 并 将 其 两 端 连接 到 两 个 文件 描述 符 。array[0] 为 读数 据 端 的 文件 
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描述 符 ,而 array[1] 则 为 写 数据 端的 文件 描述 符 。 像 一 个 打开 的 文件 的 内 部 情况 一 样 , 管 道 
的 内 部 实现 隐藏 在 内 核 中 ,进程 只 能 看 见 两 个 文件 描述 符 。 

图 10. 18 显示 了 进程 创建 一 个 管道 前 后 的 状况 。 前 一 张 图 (调用 pipe 之 前 ) 显 示 了 标准 
文件 描述 符 集 。 后 一 张 图 (调用 pipe 之 后 ) 显 示 了 内 核 中 新 创建 的 管道 ,以 及 进程 到 管道 的 
两 个 连接 。 注 意 ,类 似 于 open 调用 ,pipe 调用 也 使 用 最 低 可 用 文件 描述 符 。 


WAI pipe < ài 调用 pipe 之 后 








二- i 


进程 打开 一 些 常 规 的 文件 


内 核 创建 管道 并 设置 文件 描述 符 
图 10. 18 ”进程 创建 管道 
下 面 的 程序 pipedemo. c 展示 了 如 何 创建 管道 并 使 用 管道 来 向 自己 发 送 数据 ， 


/* pipedemo.c * Demonstrates; how to create and use a pipe 


x * Effect; creates a pipe, writes into writing 

x end, then runs around and reads from reading 

x end. A little weird, but demonstrates the idea. 
*/ 


# include <stdio. h> 
# include <unistd. h> 


main() 

{ 
int len, i, apipe[2]; /x two file descriptors. «/ 
char buf [ BUFSIZ]; /* for reading end x/ 


/* get a pipe x/ 
if ( pipe ( apipe) == -1)( 
perror( "could not make pipe"); 
exit(1); 
j 
printf("Got a pipe! It is file descriptors. { sd &d Wn", 
apipe[0], apipe[1]); | 


/* read from stdin, write into pipe, read from pipe, print x/ 


while ( fgets(buf, BUFSIZ, stdin) )( 
len - strlen( buf ); 
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if ( write( apipe[1], buf, len) != len ){ /* send */ 
perror( "writing to pipe"); /* down x/ 
break; /* pipe x/ 

} 

for (i = 0; ixlen; it+ ) /* wipe x/ 
buf[i] = 'X'; 

len = read( apipe[0], buf, BUFSIZ ) ; /x read x/ 

if ( len == -1)( /* from */ 
perror( "reading from pipe"); /* pipe */ 
break; — /* pipe x/ 

} 

if (write( 1 , buf, len ) != len ){ /* send «/ 
perror("writing to stdout"); /* to x/ 


break; /* pipe */ 


j 


图 10.19 显示 了 从 键盘 到 进程 ,从 进程 到 管道 ,再 从 管道 到 进程 以 及 从 进程 回 到 终端 的 
数据 传输 流 : | 





图 10. 19 - pipedemo. c 中 的 数据 流 


现在 已 经 学 习 了 如 何 创建 管道 ,如 何 向 管道 中 写 数据 以 及 如 何 从 管道 中 读 取 数据 。 实 
际 上 ,很 少 会 有 程序 用 管道 向 自己 发 送 数据 。 将 pipe 和 fork 结合 起 来 ,就 可 以 连接 两 个 不 同 
的 进程 了 。 
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10.6.2 使 用 fork 来 共享 管道 


当 进 程 创建 一 个 管道 之 后 ,该 进程 就 有 了 连 向 管道 两 端的 连接 。 当 这 个 进程 调用 fork 
的 时 候 , 它 的 子 进程 也 得 到 了 这 两 个 连 向 管道 的 连接 ,如 图 10. 20 所 示 。 父 进程 和 子 进程 都 
可 以 将 数据 写 到 管道 的 写 数据 端口 ,并 从 读数 据 端 口 将 数据 读 出 ,如 图 10. 21 所 示 。 两 个 进 
程 都 可 以 读 写 管道 ,但 是 当 一 个 进程 读 , 另 一 个 进程 写 的 时 候 , 管 道 的 使 用 效率 是 最 高 的 。 


共享 管道 : 

进程 调用 管道 ,内 核 创建 一 个 
管道 并 添加 连接 管道 端点 的 文 
件 描 述 符 指针 数组 


接着 进程 调用 fork, 内 核 创 建 
一 个 新 进程 并 从 父 进程 复制 连 
接管 道 端点 的 文件 描述 符 指针 
数组 


两 个 进程 都 访问 管道 的 两 端 





10.20 共享 管道 





10. 21 进程 之 间 的 数据 流 


下 面 的 程序 pipedemo2. c 说 明了 如 何 将 pipe 和 fork 结合 起 来 ,创建 一 对 通过 管道 来 通 
信 的 进程 。 | 


/* pipedemo2.c * Demonstrates how pipe is duplicated in fork() 


x * Parent continues to write and read pipe, 
x but child also writes to the pipe 
x/ TE 


# include <stdio.h> 


# define CHILD MESS "I want a cookie\n" 
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# define PAR MESS "testing.. Xn" 
i define oops(m, x) { perror(m); exit(x); } 
main() 
{ 
int pipefd[ 2 |; /* the pipe x/ 
int len; /* for write  x/ 


char buf[BUFSIZ];  /x for read */ 
int read len; 
if ( pipe( pipefd ) == -1) 
oops("cannot get a pipe", 1); 
switch( fork() ){ 
case - 1, 


oops("cannot fork", 2); 


/* child writes to pipe every 5 seconds x/ 


case 0 ， 
len = strlen(CHILD MESS); 
while ( 1 ){ 


if (write( pipefd[1], CHILD MESS, len) 1= len) 
oops("write", 3); 
sleep(5); 
} 


/* parent reads from pipe and also writes to pipe x/ 


default. 
len = strlen( PAR MESS ); 
while ( 1 ){ 


if ( write( pipefd[1], PAR MESS, len)!= len ) 
oops("write", 4); 
sleep(1); 
read len = read( pipefd[0], buf, BUFSIZ ); 
if ( read len <= 0) 
break; 


write( 1, buf, read len); 


10.6.3 使 用 pipe.fork 以 及 exec 


本 章 已 经 介绍 了 各 种 技巧 和 思路 来 编写 将 who 的 输出 连接 到 sort 的 输入 的 程序 。 大 家 
应 该 已 经 了 解 了 如 何 去 创 建 管道 ,如 何在 进程 间 共 享 管 道 ,如 何 改 变 进程 的 标准 输入 以 及 如 
何 改变 进程 的 标准 输出 。 
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在 这 里 可 以 将 这 所 有 的 技巧 结合 在 一 起 ,编写 一 个 通用 的 程序 pipe。 它 使 用 两 个 程序 的 
名 字 作 参数 ,例如 : 


pipe who sort 


pipe ls head 


程序 的 内 在 逻辑 如 下 所 示 : 


pipe(p) 
fork() 
| 
+ 一 一 一 一 一 ~ 一 一 一 一 一 一 一 一 一 + 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 
child parent 
| | 
close(p [0 ]) close(p[ 1 |) 
dup2(p [1],1) dup2(p[0], 0) 
close(p [{1]}) close(p[ 0]) 


exec "who" 


exec "sort" 





程序 代码 如 下 : 


/* pipe.c 
* Demonstrates how to create a pipeline from one process to another 
x x Takes two args, each a command, and connects 
* — av[1]s output to input of av[ 2] 
* * usage; pipe command] command2 
x effect; commandl | command2 
* * Limitations, commands do not take arguments 
* * uses execlp() since known number of args 
* * Note; exchange child and parent and watch fun 
*/ 
# include <(stdio. h> 
# include <unistd. h> 


# define oops(m,x) { perror(m); exit(x); } 


main(int ac, char x x av) 


int thepipe[ 2 |, /* two file descriptors  x/ 
newfd, /* useful for pipes  x/ 
pid; /* and the pid  x/ 


if (ac t= 3)! 
fprintf(stderr, "usage: pipe cmdl cmd2\n"); 
exit(1); 
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} 


程序 pipe. c 用 了 和 shell 一 样 的 思路 和 技术 来 创建 管道 。 但 是 shell 并 不 像 pipe. c 一 样 
运行 外 部 程序 。shell 首先 创建 管道 ,然后 调用 fork 创建 两 个 新 进程 ,再 将 标准 输入 和 输出 重 
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j 
if ( pipe( thepipe ) == -1) /* get a pipe x/ 


oops("Cannot get a pipe", 1); 


/一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 x/ 
/* now we have a pipe, now lets get two processes x/ 
if ( (pid = fork()) == -1) /* get a proc x/ 


oops( "Cannot fork", 2); 


/* Right Here, there are two processes x/ 


/* parent will read from pipe x/ 


if ( pid > 0 ){ /* parent will exec av[2] x/ 
close(thepipe[1]); /x parent doesnt write to pipe x/ 


if ( dup2(thepipe[ 0], 0) == -1) 


oops( "could not redirect stdin",3); 


close(thepipe[0]); /x stdin is duped, close pipe x/ 
execlp( av[2], av[2], NULL); 
oops(av[2], 4); 

} 


/* child execs av[ 1 | and writes into pipe x/ 
close(thepipe[ 0 1). /* child doesrt read from pipe x/ 
if ( dupZ(thepipe[1], 1) == -1) 


oops( "could not redirect stdout", 4); 


close(thepipe|1]; /* stdout is duped, close pipe x/ 
execlp( av[1], av[1], NULL); 
oops(av[1], 5); 


定向 到 创建 的 管道 ,最 后 再 通过 exec 来 执行 两 个 程序 。 
10.6.4 技术 细节 : 管道 并 非 文件 


管道 在 许多 方面 都 类 似 于 普通 文件 。 进 程 使 用 write 将 数据 写 人 管道 ,又 通过 read 把 数 
据 读 出 来 。 像 文件 一 样 ,管道 是 不 带 有 任何 结构 的 字 节 序列 。 另 一 方面 ,管道 又 与 文件 不 
辣 ,例如 文件 的 结尾 是 否 也 适用 于 管道 呢 ? 下 列 技术 细节 清楚 地 阐述 了 文件 与 管道 的 相同 


点 与 不 同 点 。 
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l. 从 管道 中 读数 据 

(1) 管道 读 取 阻塞 

当 进 程 试 图 从 管道 中 读数 据 时 ,进程 被 挂 起 直到 数据 被 写 进 管道 。 那 么 如 何 避 免 进程 
永 无 止境 地 等 待 下 去 呢 ? 

(2) 管道 的 谈 取 结束 标志 

当 所 有 的 写 者 关闭 了 管道 的 写 数据 端 时 ,试图 从 管道 读 取 数据 的 调用 返回 0, 这 意味 着 
文件 的 结束 。 

(3) 多 个 读者 可 能 会 引起 麻烦 

管道 是 一 个 队列 。 当 进程 从 管道 中 读 取 数据 之 后 ,数据 已 经 不 存在 了 。 如 果 两 个 进程 
都 试图 对 同一 个 管道 进行 读 操 作 , 在 一 个 进程 读 取 一 些 之 后 , 另 一 个 进程 读 到 的 将 是 后 面 的 
内 容 。 它 们 读 到 的 数据 必然 是 不 完整 的 ,除非 两 个 进程 使 用 某 种 方法 来 协调 它们 对 管道 的 
访问 。 

2. 向 管道 中 写 数 据 

CD 写 人 数据 阻塞 直到 管道 有 空间 去 容纳 新 的 数据 

管道 容纳 数据 的 能 力 要 比 磁盘 文件 差 的 多 。 当 进程 试图 对 管道 进行 写 操 作 的 时 候 , 此 
调用 将 挂 起 进程 直到 管道 中 有 足够 的 空间 去 容纳 新 的 数据 。 如 果 进 程 想 写 人 1000 个 字 节 ， 
而 管道 中 现在 只 能 容纳 500 个 字 节 ,那么 这 个 写 人 调用 就 只 好 等 待 直到 管道 中 再 有 500 个 字 
节 空 出 来 。 如 果 某 进程 试图 写 100 万 字 节 , 那 结 果 会 怎样 ? 调用 会 不 会 永远 等 待 下 去 呢 ? 

(2) 写 人 必须 保证 一 个 最 小 的 块 大 小 

POSIX 标准 规定 内 核 不 会 拆 分 小 于 512 字 节 的 块 。 而 Linux 则 保证 管道 中 可 以 存在 
4096 字 节 的 连续 缓存 。 如 果 两 个 进程 向 管道 写 数据 ,并 且 每 一 个 进程 都 限制 其 消息 不 大 于 
212 字 闻 ,那么 这 些 消息 都 不 会 被 内 核 拆 分 。 

(3) 知 无 读者 在 读 取 数 据 , 则 写 操 作 执行 失败 

如 果 所 有 的 读者 都 已 将 管道 的 读 取 端 关 闭 ,那么 对 管道 的 写 人 调用 将 会 执行 失败 。 如 
有 果 在 这 种 情况 下 ,数据 还 可 以 被 接收 的 话 , 它 们 会 到 哪里 去 呢 ? 为 了 避免 数据 丢失 ,内 核 采 
用 了 两 种 方法 来 通知 进程 :“ 此 时 的 写 操作 是 无 意义 的 ”。 首 先 ,内 核发 送 SIGPIPE 消息 给 
进程 。 知 进程 被 终止 , 则 无 任何 事情 发 生 。 否 则 write 调用 返回 一 1, 并 且 将 errno BH 
EPIPE, 


小 结 


1. 主要 内 容 

输入 /输出 重 定向 允许 完成 特定 功能 的 程序 通过 交换 数据 来 进行 相互 协作 。 

© Unix 默认 规定 程序 从 文件 描述 符 0 读 取 数据 , 写 数据 到 文件 描述 符 1, 将 错误 信息 输 
出 到 文件 描述 符 2。 这 三 个 文件 描述 符 称 为 标准 输入 、 输 出 及 标准 错误 输出 。 

。 当 登 录 到 Unix 系统 中 ,登录 程序 设置 文件 描述 符 0.1.2。 所 有 的 连接 .文件 描述 符 
都 会 从 父 进 程 传递 给 子 进 程 。 它们 也 会 在 调用 exec 时 被 传递 。 

。 创建 文件 描述 符 的 系统 调用 总 是 使 用 最 低 可 用 文件 描述 符号 。 
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重 定向 标准 输入 、 输 出 以 及 错误 输出 意味 着 改变 文件 描述 符 0,1,2 的 连接 。 有 很 多 
种 技术 来 重 定 回 标准 Io. 

*。 管道 是 内 核 中 的 一 个 数据 队列 ,其 每 一 端 连接 一 个 文件 描述 符 。 程 序 通过 使 用 pipe 

系统 调用 创建 管道 。 

。 当 父 进程 调用 fork 的 时 候 , 管 道 的 两 端 都 被 复制 到 子 进程 中 。 

。 只 有 有 共同 父 进程 的 进程 之 间 才 可 以 用 管道 连接 。 

2. 下 一 步 做 什么 | 

传统 的 Unix 管道 在 进程 间 进 行 数据 的 单 向 传输 。 若 两 个 进程 希望 来 回 传递 数据 又 该 
如 何 ? 两 个 没有 关联 的 进程 或 两 个 进程 在 不 同 的 机 器 上 , 那 该 如 何 实现 呢 ? 在 后 面 几 章 中 ， 
将 更 加 细致 地 研究 一 下 管道 以 及 网 络 编程 ,使 用 管道 的 思路 可 以 轻易 地 扩展 到 套 接 字 
(socket) EX, 

3. 习题 

10.1 符号 法 > 可 以 告诉 shell 将 输出 添加 到 文件 未 尾 上 。shell 是 使 用 自动 添加 模式 
〈 见 第 5 章 ) ,还 是 简单 地 寻找 文件 的 结尾 并 从 这 里 开始 写 数 据 ? 通过 shell 脚本 
设计 一 个 试验 来 回答 这 个 问题 。 


10.2 在 pipe. c 中 , 父 进程 运行 着 消费 数据 的 程序 , 子 进程 运行 着 产生 数据 的 程序 。 如 
果 这 两 个 程序 的 角色 换 一 换 , 那 么 结果 有 何 差 异 ? 将 测试 语句 if C pid 0083 if 
(pid==0), 角 色 就 可 以 被 换 过 来 。 这 将 会 导致 什么 情况 的 发 生 ? HHA? 


10.3 i5 X shell 支持 管道 ,需要 怎样 做 改动 ? 首先 ,如 何 修改 控制 流 来 识别 并 处 理 以 
管道 符号 结尾 的 命令 ? 其 次 ,车 有 许多 命令 ,它们 之 间 通 过 管道 符号 来 分 割 , 那 
又 该 做 怎样 的 修改 ? 


10.4 在 pipe. c 中 , 读 进程 sort 关闭 了 从 父 进 程 那 里 复制 来 的 管道 写 数据 端 。 修 改 代 
码 让 读 进 程 不 要 关闭 管道 的 写 数 据 端 。 运 行程 序 , 并 对 结果 做 出 解释 。 


10.5 在 这 一 章 的 开始 学 习 了 将 标准 输入 、 输 出 重 定向 到 文件 的 符号 。 知 道 重 定向 符 
号 和 文件 名 可 以 出 现在 命令 行 中 的 任意 地 方 ,并 且 重 定向 符号 和 文件 名 没有 作 
为 参数 传递 给 程序 。 
前 面 编写 的 shell 中 ,在 控制 流 的 什么 地 方 识别 出 重 定向 的 请 求 ? 何 处 实现 这 个 
HER? 大 用 户 输入 set>varjlist, 结 果 又 如 何 ? 这 个 shell 会 允许 你 将 内 部 命令 
的 输出 重 定向 吗 ? 如何 将 此 功能 加 入 自己 编写 的 shell 中 呢 ? 


10.6 JH P f A. sort data data, 结 果 会 如 何 呢 ?” 这 个 命令 的 问题 何在 ? 标准 Unix 
shell 如 何 处 理 这 一 问题 呢 ? 自己 所 写 的 shell 又 该 如 何 去 处 理 这 个 问题 呢 ? 


10.7 已 经 学 习 了 如 何 将 程序 的 标准 输入 输出 连接 到 一 个 文件 。 上 面 所 有 的 例子 中 都 
假设 这 里 的 文件 是 常规 磁盘 文件 。 那么 是 否 可 以 将 输入 输出 重 定向 到 设备 文件 
中 呢 ? 如果 调 用 了 close(0) 和 openC"/dev/tty",0) ,结果 会 如 何 呢 ? shell 是 如 何 

来 处 理 命令 who>/dev/tty 的 ? 
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10.8 在 pipe.c 中 ,调用 了 fork 和 exec 函数 ,但 是 并 没有 调用 wait。 这 是 为 什么 ? 


10.9 讨论 一 下 dup 5 link 的 共同 点 与 区 别 。 
4. 编程 练习 
10.10 ”修改 脚本 watch. sh ,使 它 可 以 有 更 多 的 功能 。 
(1) 除了 打印 所 有 用 户 的 登录 和 注销 情况 外 ,新 的 版 本 要 求 可 以 通过 命令 行 参 
数 来 传递 一 个 包含 要 监控 的 用 户 列表 文件 。 
(2) 修改 后 的 程序 仅仅 当 有 新 的 用 户 登 录 或 注销 时 , 才 将 结果 打印 出 来 ,而 不 是 
每 次 循环 都 打印 一 些 内 容 。 
(3) who 命令 除了 列 出 用 户 名 之 外 还 有 登录 时 间 .终端 名 称 等 。 可 能 对 某 用 户 
在 哪个 终端 窗口 登录 并 不 感 兴趣 。 修 改 程 序 使 其 仅仅 当 用 户 从 登录 状态 变 
到 非 登 录 状 态 时 才 报 告 结 果 , 而 不 去 考虑 终端 的 变化 。 
(4) 早期 的 Unix 版 本 将 数据 存储 在 当前 目录 下 的 文件 prev 和 curr 中 ,并 且 在 
程序 停止 运行 时 ,并 没有 对 这 两 个 文件 做 处 理 。 这 样 的 设计 有 哪些 缺点 ? 
修改 脚本 ,使 其 使 用 临时 的 文件 ,并 在 结束 运行 的 时 候 删 除 它们 。 看 一 下 如 
何 使 用 shell 中 的 trap 命令 以 及 mktemp RS., 
10.11 修改 whotofile. c 程序 ,使 其 将 who f 命令 S naM 个 文件 的 未 尾 。 确 保 
在 此 文件 不 存在 时 ,程序 照样 可 以 正常 运 
10.12 编写 一 个 名 为 sortfromfile. c 的 程序 ,将 sort 命令 的 输入 重 定向 ,使 其 从 文件 中 
读 人 人 数据。 文件 名 由 命令 行 参 数 来 指定 。 
10.13 扩展 pipe. c 程序 来 处 理 三 节 式 管道 。 新 版 本 的 Unix 程序 可 以 接收 三 个 程序 名 
称 作 为 参数 ,并 让 它们 以 管道 的 方式 交互 数据 。 命 令 
pipe3 who sort head 
应 该 和 who|sort| head 起 到 相同 的 作用 。 
10.14 扩展 上 题 的 程序 pipe3 使 其 可 以 处 理 任意 多 的 参数 ， 
10.15 tee 工具 允许 重 定 问 数 据 到 文件 并 且 将 数据 传递 给 另 一 个 程序 。 例 如 : 


who | tee userlist |sort >> list2 


产生 一 个 未 排序 文件 和 一 个 排序 文件 ， userlist 和 list2。 传 给 tee 的 参数 是 一 个 

文件 名 ,可 以 从 参考 手册 得 到 更 详细 的 信息 。 编 写 一 个 名 叫 progtee 的 程序 来 

重 定 问 数据 到 程序 ,同时 通过 管 道 将 数据 传递 给 另 一 个 程序 。 例 如 命令 
who|progtee mail smith|sort|progtee mail - s "hello" 


root > list2 


将 一 个 未 排序 的 列表 作为 邮件 发 给 smith ,将 排 好 序 的 文件 发 给 root, ELE — 0) 
排 好 序 文件 的 备份 放 到 文件 list2 中 。 
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写 数 据 到 标准 输出 的 程序 往往 并 不 在 意 文件 描述 符 是 联结 到 终端 还 是 磁盘 文 
件 。 本 章 中 似乎 暗示 进程 并 没有 方法 来 了 解 文件 描述 符 的 指向 。 其 实 这 并 不 
IE. EK isatty(fd) 可 以 用 来 做 判断 : 若 文件 描述 符 fd 指向 终端 , 则 函数 
返回 为 true,isatty 使 用 系统 调用 fstat。 阅 读 一 下 关于 fstat 的 介绍 ,并 且 用 它 
写 一 个 图 数 isaregfileCfd) ,使 其 在 fd 指向 常规 磁盘 文件 时 返回 true, 
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概念 和 技巧 
。 客户 /服务 器 模型 
。 用 管道 来 双向 通信 
© 协同 进程 (coroutines) 
。 文件 /进程 的 相似 性 
。 什么 是 socket, 为 什么 需要 socket, 如 何 使 用 socket 
。 网 络 服务 
。 用 socket 编写 客户 /服务 器 程序 
相关 系统 调用 和 函数 
* fdopen 
e popen 
socket 
* bind 


listen 


accept 


connect 


11.1. 产品 和 服务 


像 制 造 商 利用 传送 带 在 工人 之 间 传 递 产品 一 样 ,Unix 程序 员 可 以 通过 管道 来 传送 数字 
信息 。 

并 非 所 有 的 商务 过 程 都 是 像 工 厂 的 生产 线 一 样 是 单 向 流动 的 , 某 些 形式 的 通信 方式 
是 双向 的 。 考 虑 一 下 衣服 干洗 店 .律师 还 有 兽医 。 你 在 把 衣服 交 给 干洗 店 , 把 宠物 送 到 曾 
医 那 边 ,或 是 将 文档 通过 e-mail 发 给 律师 之 后 ,只 需 等 待 他 们 把 处 理 好 的 东西 发 回 , 而 并 不 
需要 像 汽 车 工厂 里 的 工人 那样 把 车 传递 给 下 一 个 工人 。 在 这 个 例子 中 ,需要 由 其 他 人 完 
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成 的 工作 就 称 之 为 服务 ,而 自己 则 是 服务 的 客户 。 
上 面 的 例子 跟 Unix 有 什么 关系 呢 ? Unix 中 的 管道 可 以 把 数据 从 一 个 进程 传送 到 另外 


一 个 进程 。 进 程 和 管道 不 但 类 似 于 二 条 生产 线 来 完成 产品 * 还 类 似 于 一 个 大 的 服务 产业 。 
本 章 将 关注 于 进程 间 的 数据 通信 ,这 也 是 客户 /服务 器 编程 的 基础 知识 。 


11.2 一 个 简单 的 比喻 : 饮料 机 接口 


程序 处 理 信息 就 像 人 们 消耗 饮料 一 样 。 以 图 11. 1 中 的 自动 碳酸 饮料 机 为 例 , 在 你 投 
ABB , 按 下 按钮 之 后 ,饮料 就 自动 流出 。 在 此 过 程 中 ,饮料 机 内 的 分 配器 在 做 什么 工作 
呢 ? 在 饮料 机 内 ,应 该 有 一 桶 碳酸 水 和 男 一 捅 浓缩 的 饮料 潮水 7 当 按 下 按钮 时 ,将 激活 一 
个 配制 原材料 并 不 断 地 传送 出 产生 的 碳酸 饮料 的 过 程 。 男 一 种 方法 则 是 只 需要 将 一 瓶 预 
先 配 制 好 的 碳酸 饮料 装 到 一 个 抽水 泵 上 , 按 丰 按 钮 这 个 动作 就 简单 地 将 饮料 抽出 并 送 给 
外 面 的 杯子 。 


搅拌 器 





根据 需求 搅拌 来 自 存储 部 分 
图 11.1 动态 产生 或 来 自 静 态 钦 料 


就 像 碳酸 饮料 分 配器 一 样 ，Unix 提供 一 个 接口 来 处 理 可 能 来 自 不 同 数据 源 的 数据 ,如 
图 11.2 所 示 。 


4 种 类 型 的 数据 源 
1. 磁盘 文件 
2. 设备 
3. 管道 
4. Sockets 


jo 使 用 同一 个 1/O 接口 





图 11.2 一 个 接口 和 不 同 的 数据 源 


。 (1,2) E/E UE 

用 open 命令 连接 ,用 read 和 write 传递 数据 。 

。(3) 管 道 

用 pipe 命令 创建 ,用 {fork 共享 ,用 read 和 write 传递 数据 。 
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* (4)Sockets | 
FH socket, listen 和 connect 连接 ,用 read 和 write 传递 数据 。 


11.3 be: Unix 中 使 用 的 计算 器 


几乎 每 个 版 本 的 Unix 都 包含 bc 计算 器 ,尽管 这 些 计算 器 的 版 本 有 些 差 异 。be 计算 器 
中 包含 变量 ,循环 和 函数 的 功能 ,并 如 在 第 1 章 中 所 看 到 的 那样 支持 对 长 整数 的 处 理 ， 


$ bc 
17^123 
2214202463012020735932057376423695752334560321698733173224049701\ 
6947292822996637496750906355872025391170927994632063938187990037\ 
220685580536286573569713 


FE FT AR FEY JR BR EC FT 19 SE 

l. bc 并 不 是 一 个 计算 器 

一 个 计算 器 程序 分 析 它 的 输入 ,执行 操作 ,然后 将 输出 打印 出 来 。 大 部 分 版 本 的 bc 程序 
都 只 分 析 输 入 ,并 不 执行 操作 2。 其实,bc 在 内 部 启动 了 de 计算 器 程序 ,并 通过 管道 与 其 进 
行 通信 。 dc 是 一 个 基于 栈 的 计算 器 , 它 需 要 用 户 在 指定 具体 的 操作 符 之 前 , 先 输入 所 要 操作 
的 数据 。 例 如 ,用户 输入 2 2 十 来 代表 2 加 2 的 操作 。 

图 11.3 Bos f bc 如 何 来 处 理 2 十 2 的 过 程 : 用 户 输入 2 十 2; 然 后 按 回 车 。be 从 标准 输 
入 读 取 该 表达 式 , 分 析出 数据 和 操作 符 , 接 下 来 把 一 系列 的 命令 “2”,“2”,“ 十 ”和 p 传 给 de, 
dc 则 将 数据 入 栈 ,运行 加 操作 ,最 后 把 栈 顶 的 数值 送 到 标准 输出 。 





图 11.3 bc 和 dc 作为 协同 进程 


bc 从 连接 到 dc 标准 输出 的 管道 上 读 取 结果 ,再 把 结果 转发 给 用 户 。 这 样 的 话 , bc 其 至 
都 不 需要 持 有 变量 。 如 果 用 户 输入 x=2+2, bc 告诉 dc 执行 该 操作 并 且 把 结果 存 到 寄存 器 
x 中。 命令 bc-e 可 以 显示 分 析 器 传 给 计算 器 的 数据 7 就 连 GNU 版 本 的 be 也 是 把 用 户 的 
输入 转换 成 基于 栈 的 后 缀 表达 式 。 

2. 从 bc 方法 中 得 到 的 思想 

(OD 客户 /服务 器 模型 | 

bc/dc 程序 对 是 客户 /服务 器 模型 程序 设计 的 一 不 实例 。dec 提供 服务 : 计算 。dc 所 识别 
的 语言 是 众所周知 的 逆 波 兰 表 示 法 。bc 和 dc 之 间 通 过 标准 输入 stdin 和 标准 输出 stdout 进 
行 通信 。bc 提供 用 户 界 面 , 并 使 用 dc 提供 的 服务 。 这 里 bc 被 称 为 dc HEP. 


(D GNU 版 本 的 bc 是 执行 计算 操作 的 。 





* 328 * Unix/Linux 编程 实践 教程 





这 两 个 部 分 是 根本 上 独立 的 程序 。 可 以 使 用 不 同 版 本 的 dc, 这 并 不 影响 bc 正常 工作 。 
类 似 地 ,可 以 编写 一 个 图 形 界面 的 be, 而 仍 用 dc 作为 计算 引擎 。 其 至 可 以 用 这 样 一 个 程序 
来 替换 dc. 该 程序 先 分 析 dc 所 识别 的 语言 ,然后 把 它 所 要 做 的 工作 传 给 可 能 位 于 另 一 台 更 
高 速 计算 机 上 的 程序 。 IH | 

(2) 双向 通信 

客户 /服务 器 模型 不 同 于 生产 线 的 数据 处 理 模 型 , 它 要 求 一 个 进程 既 跟 男 一 个 进程 的 标 
准 输入 也 要 和 它 的 标准 输出 进行 通信 。 传 统 的 Unix 的 管道 只 是 单方 向 地 传送 数据 了 ,图 11. 
3 给 出 了 bc 和 dc 之 间 的 两 个 管道 ,其 中 上 面 的 管道 把 一 些 计 算命 令 传 给 dc 的 标准 输入 ,下 
面 的 管道 把 dc 的 标准 输出 传 给 bc。 

(3) 永久 性 服务 

bc 只 是 让 单一 的 dc 进程 处 于 运行 状态 ,这 就 不 同 于 shell 程序 ,这 种 程序 中 的 每 个 用 户 命 
令 都 创建 一 个 新 的 进程 。bc 程序 持续 不 断 地 和 dc 的 同一 个 实例 进行 通信 ,把 用 户 的 输入 转换 
成 命令 传 给 de。 他们 之 间 的 关系 并 不 同 于 标准 函数 中 所 使 用 的 调用 返回 机 制 。 

bc/dc 对 被 称 之 为 协同 进程 (coroutines) 以 用 来 区 别 于 子 程序 (subroutines) 。 两 个 程序 
都 持续 运行 , 当 其 中 的 一 个 程序 完成 自己 的 工作 后 将 把 控制 权 传 给 舅 一 个 程序 。;bc 的 任务 
是 分 析 输 入 及 打印 ,而 de 则 负责 计算 。 


11.3.1 编写 bc: pipe, fork, dup. exec 


图 11. 4. 显 示 了 内 核 将 用 户 连接 到 bc 并 将 be 连接 到 :de 的 数据 连接 。 这 里 以 该 图 作为 
编写 下 面 代 码 的 指南 。 \ 

(1) 创建 两 个 管道 。 i 

(2) 创建 一 个 进程 来 运行 dc。 

(3) 在 新 创建 的 进程 中 , 重 定 向 标 准 输入 和 标准 输出 到 管道 ,然后 运行 exec dc。 

(4) 在 父 进 程 中 , 读 取 并 分 析 用 户 的 输入 ,将 命令 传 给 dc, dc 读 取 响应 ,并 把 啊 应 传 给 
HP. 





图 11.4 bc、dc 和 内 核 


D 有 一 些 管道 也 能 双向 传输 数据 ( 见 小 结 中 编程 练习 11. 11) 。 
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下 面 是 tinybc. c 的 源 程序 ,这 是 一 个 简单 版 本 的 bc, 用 sscanf 分 析 输 入 ,并 通过 两 个 管 
道 与 dc 通信 。 


/* * tinybc.c x a tiny calculator that uses dc to do its work 
x x * demonstrates bidirectional pipes 
x x * input looks like number op number which 
* x tinybc converts into number \n number Mn op \n p 
xx and passes result back to stdout 
* x* 
xx 十 一 一 一 一 一 一 一 一 一 一 一 十 十 一 一 一 一 一 一 一 一 一 一 十 
x x stdin 0 >== pipetode ====> 
* x | tinybc | | dc ~ 
x X stdout «1 «77 pipefromdc == 
* x 二 一 一 一 一 一 一 一 一 一 一 一 + 二 一 一 一 一 一 一 一 一 一 一 十 
x* x* 
* x * program outline 
* x a. get two pipes 
xx b. fork (get another process) 
* x c. in the dc -~ to - be process, 
* Xx connect stdin and out to pipes 
* x then execl dc 
xx d. in the tinybc - process, no plumbing to do 
x x just talk to human via normal i/o 
x* x and send stuff via pipe 
* x e. then close pipe and dc dies 
xx * note; does not handle multiline answers 
x x/ 


# include < stdio. h> 


# define oops(m,x) | perror(m); exit(x); } 
main() 
( 
int pid, todc[2], fromdc[2]; /* equipment */ 


/* make two pipes x/ 


if ( pipe(todc) == -1 || pipe(fromdc) == -1) 
oops( "pipe failed",1); 


/* get a process for user interface x/ 


if ( (pid = fork()) == -1) 


oops("cannot fork", 2); 
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if ( pid == 0) /x child is dc «/ 
be dc(todc, fromdc); 

else { 
be bc(todc, fromdc) ; /* parent is ui x/ 
wait(NULL); /* wait for child x/ 


be dc(int in[2], int out[2]) 

/* 
* set up stdin and stdout, then execl dc 
*/ 

{ 


/* setup stdin from pipein */ 


if ( dup2(in[0],0) == -1) /* copy read end to 0 x/ 
oops("dc; cannot redirect stdin",3); 

closeCin[0 D; /x moved to fd 0 x/ 

close(in[1]); /x won! t write here x/ 


/* setup stdout to pipeout x/ 


if ( dup2(out[1], 1) == -1) /* dupe write end to 1 x/ 
oops("dc; cannot redirect stdout",4); 

close(out| 15; /x moved to fd 1 x/ 

close(out[0]); /* won’t read from here «/ 


/* now execl dc with the — option x/ 
execlpt( "dc", "dc", " Å" NULL 2; 
oops( "Cannot run dc", 5); 
} 


be bc(int todc[2], int fromdc[2]) 


/* 
x read from stdin and convert into to RPN, send down pipe 
x then read from other pipe and print to user 
x Uses fdopen() to convert a file descriptor to a stream 
*/ 
1 
int numl, num2; 
char operation[BUFSIZ], message[BUFSIZ], * fgets() ; 
FILE *fpout, * fpin, * fdopen(); 
/* setup */ 
close(todc[0]); /* won’t read from pipe to de */ 


close(fromdc|1)); /* won't write to pipe from dc x/ 
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fpout = fdopen( todc[1],"w" ); /x convert file desc- x*/ 
fpin = fdopen( fromdc[0], "r" ); /* riptors to streams x/ 
if ( fpout == NULL || fpin == NULL ) 

fatal( "Error convering pipes to streams") ; 
/* main loop «/ 
while ( printf("tinybc, "), fgets(message,BUFSIZ,stdin) ! = 

NULL ) { 


/* parse input */ 

if ( sscanf (message, " $d&[ — + */*]%d", 
&numl , operation, &num2)! = 3) { 
printf( "syntax error\n") ， 


continue; 


if ( fprintf( fpout , "*%d\n%d\n%c\np\n", numi, num2, 


* operation ) == EOF ) 
fatal( "Error writing"); 
fflush( fpout ); 
if ( fgets( message, BUFSIZ, fpin ) == NULL) 
break; 
printf("€&d $c %d = %s", numl, * operation , num2, message); 


, F 


) 
fclose(fpout); /* close pipe x/ 


fclose(fpin); /x dc will see EOF */ 


} 


fatal( char x mess[ | ) 

( 
fprintf(stderr, "Error; % s\n" 
exit(1); 


, mess) ; 


下 面 是 tinybe 的 运行 过 程 ; 


$cc tinybc.c - o tinybc ; . /tinybc 
tinybe; 2+2 

2+2=4 

tinybe: 55^5 

55^5 = 503284375 

tinybc,; 


仔细 观察 程序 的 输出 ,看 一 看 哪 一 部 分 是 来 自 于 哪个 程序 。tinybc 产生 了 提示 符 并 再 一 
次 显示 出 算术 表达 式 。 计 算 的 结果 是 由 dc 产生 的 字符 串 ,tinybc 只 是 从 管道 中 读 取 该 字符 
串 然后 把 它 传 给 输出 。 
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11.3.2 对 协同 进程 的 讨论 


其 他 的 一 些 Unix 工具 是 否 也 能 被 看 成 协同 进程 呢 ? sort 工具 能 否 被 当做 协同 进程 使 
用 ? 答案 是 否定 的 。 在 sort 产生 输出 之 前 , 它 读 取 文件 中 所 有 的 数据 。 通 过 管道 来 传送 文 
件 结尾 标志 的 惟一 途径 是 将 写 数据 端 关闭 。 一 旦 关闭 了 写 的 进程 ,就 不 能 再 传送 其 他 需要 
排序 的 数据 了 。 

从 另 一 方面 讲 ,dc 是 逐 行 处 理 数据 和 命令 的 。 与 dc 的 交互 很 简单 并 可 预测 。 当 需要 de dT 
印 一 个 数据 时 ,将 会 得 到 一 行文 本 。 当 需要 de 把 数据 压 栈 时 ,不 会 有 响应 被 传 回 。 

一 个 客户 /服务 器 模型 程序 要 成 为 协同 系统 必须 有 明确 指明 消息 结束 的 方法 ,并 且 程序 
必须 使 用 简单 并 可 预测 的 请 求 和 应 答 。 


11.3.3 fdopen: 让 文件 描述 符 像 文件 一 样 使 用 


在 tinybe. c 中 使 用 了 库 R% fdopen, fdopen 与 fopen 类 似 , 返 回 一 个 FILE x 类 型 的 
值 , 不 同 的 是 此 函数 以 文件 描述 符 而 非 文 件 作为 参数 。 

使 用 fopen 的 时 候 , 将 文件 名 作为 参数 传 给 它 。fopen 可 以 打开 设备 文件 也 可 以 打开 常 
规 的 磁盘 文件 。 如 只 知道 文件 描述 符 而 不 清楚 文件 名 的 时 候 可 以 使 用 fdopen 命令 。 例 如 在 
管道 的 例子 中 ,把 一 个 通 向 管道 的 连接 转换 成 FILE x 类 型 值 之 后 ,就 可 以 使 用 标准 缓存 的 
I/O 操作 来 对 其 进行 操作 了 。 注 意 tinybc. c 是 如 何 使 用 fprintf 和 fgets 来 通过 管道 和 dc 进 
行 通信 的 。 

使 用 fdopen 使 得 对 远 端 的 进程 的 处 理 就 如 同 处 理 常规 文件 一 样 。 下 一 节 将 剖析 popen 
困 数 ,此 函数 通过 封装 pipe. fork, dup 和 exec 等 系统 调用 使 得 对 程序 和 文件 的 操作 变 成 了 
一 回 事 。 


11.4 popen: 让 进程 看 似 文件 
这 一 节 将 继续 学 习 一 个 程序 如 何 通 过 和 另外 -个 进程 通信 来 得 到 服务 。 本 节 还 将 剖析 
popen JF eR 2C, 8 f£ popen 及 其 工作 原理 ,最 后 给 出 popen 实现 版 本 。 
11.4.1 popen 的 功能 
fopen 打开 一 个 指向 文件 的 带 缓存 的 连接 ， 


FILE* fp; /* a pointer to a struct x/ 

fp = fopen("filel","r"); /* args are filename,connection type x/ 
c= getc(fp); /* read char by char x/ 
fgets(buf,len,fp); /x line by line x/ 

fscanf(fp,"& d% d$ s", &x,&y, 20; /* token by token x/ 

fclose(fp); /* close when done x/ 


fopen 需要 两 个 字符 串 变量 作为 参数 : 文件 名 和 连接 类 型 (例如 :“r”“w”>、“a”、…)。popen 
看 上 去 跟 fopen 很 类 似 。popen 打开 一 个 指向 进程 的 带 缓冲 的 连接 . 
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FILE x fp; /* same type of struct x/ 

fp popen( "1s", "r") /* args are program name, connection type */ 
fgets(buf,len,fp); /* exactly the same functions x/ 
pclose(fp); /* close when done */ 


图 11.5 显示 了 popen 和 fopen 之 间 的 相似 性 。 两 者 使 用 相同 的 语法 格式 ,并 具有 相同 


的 返回 值 类 型 。 


popen 的 第 一 个 参数 是 要 打开 的 命令 的 名 称 ; 它 可 以 是 任意 的 shell 命令 。 


第 二 个 参数 可 以 是 “r” 或 “w”, 但 决 不 会 是 “a”。 





popen ("ls", "£") 





fopen ("file", "P 


图 11.5 fopen 和 popen 


下 面 的 程序 将 whol sort 作为 数据 源 ,通过 popen 来 获得 当前 用 户 排序 列表 : 


/* popendemo. c 


* . demonstrates how to open a program for standard i/o 


x important points; 


* 


* 


* 


* 


1. popen() returns a FILE * , just like fopen() 
2. the FILE * it returns can be read/written 
with all the standard functions 


3. you need to use pclose() when done 


x/ 
# include <stdio.h> 
# include <stdlib.h> 
int main() 
{ 
FILE * fp; 
char buf[100]; 
int i = 0; 
fp = popen( "who|sort", "r" ); /* open the command */ 


while ( fgets( buf, 100, fp) != NULL) /x read from command x/ 
printf("*3d $s", i++ , buf); /x print data x/ 


pclose( fp ); /* IMPORTANT! x/ 


return 0; 





ke ee ree rer ria 
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第 二 个 例子 将 popen 和 邮件 程序 相连 接 ,用 来 提示 用 户 一 些 系统 故障 


/* popen ex3.c 


x shows how to use popen to write to a process that 
x reads from stdin. This program writes email to 

x two users. Note how easy it is to use fprintf 

* to format the data to send. 

*/ 


# include <(stdio. h> 


main() 


FILE * fp; 


fp = popen( "mail admin backup", "w" ); 
fprintf( fp, "Error with backup!! \n" ); 


pclose( fp ); 


pclose 命令 是 必须 的 。 

当 完 成 对 popen 所 打开 连接 的 读 写 后 ,必须 使 用 pclose 关闭 连接 ,而 不 能 用 fclose。 进 
程 在 产生 之 后 必须 等 待 退出 运行 ,否则 它 将 成 为 僵尸 进程 (zombie)。 而 pelose 中 调用 了 
wait 函数 来 等 待 进程 的 结束 。 


11.4.2 实现 popen: 使 用 fdopen 命令 


popen 是 如 何 工作 的 ?如 何 来 实现 它 ? popen 运行 了 一 个 程序 并 返回 指向 该 程序 标准 
输入 或 标准 输出 的 连接 。 | 

这 里 需要 一 个 新 的 进程 来 运行 程序 ,所 以 要 用 到 fork 命令 。 需 要 一 个 指向 该 进程 的 连 
接 , 因 此 需要 使 用 管道 。 并 且 使 用 fdopen 命令 将 一 个 文件 描述 符 定向 到 缓冲 流 中 。 最 后 ,在 
该 进程 中 要 能 够 运行 任何 shell 命令 ,所 以 要 用 到 exec。 但 是 会 运行 什么 程序 呢 ? 惟一 能 够 
运行 任意 shell 命令 的 程序 是 shell 本 身 即 /bin/sh。 为 了 使 程序 员 可 以 方便 的 使 用 ,sh 支持 
-c 选 项 ,用 以 告诉 shell 执行 某 命令 然后 退出 。 例 如 ， 


sh -c "who| sort" 


告诉 sh 执行 命令 行 wholsort, 如 图 11.6 Pra. 
这 里 合并 了 pipe, fork, dup2 和 exec 等 系统 调用 ,其 流程 如 下 ， 


pipe(p) 
fork() 


+ 一 一 一 一 一 一 一 二 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 + 
close(p[1]); close(p[0 D ; 
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fp = fdopen(p[0], "r'5; dup(pl1],1); 
return fp; close(p[1]); 


exec ( "/bin/sh", "hb" "s c" cmd, NULL) ; 


sh -c "ls" 





11.6 从 shell 命令 中 读 取 


下 面 的 程序 popen. c 是 上 述 流 程 的 一 个 实现 : 


/* popen.c — a version of the Unix popen() library function 


x FILE x popen( char * command, char * mode ) 

x command is a regular shell command 

x mode is "r" or "w" 

x returns a stream attached to the command, or NULL 
x execls "sh" "一 C" command 

x todo; what about signal handling for child process? 

x/ 


# include <stdio.h> 
i include < signal. h> 


# define READ 0 
# define WRITE 1 


FILE * popen(const char * command, const char * mode) 
{ 


int pfp[2], pid; /x the pipe and the process x/ 
FILE * fdopen(), * fp; /* fdopen makes a fd a stream x/ 
int parent end, child end; /* of pipe */ 

if ( xmode == 'r' ){ /* figure out direction x/ 


parent end - READ; 
child end - WRITE ; 
! else if ( «mode == 'w' ){ 
parent end = WRITE; 
child end - READ ; 


} else return NULL ; 


if ( pipe(pfp) == -1) /* get a pipe */ 
return NULL; 


} 
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if ( (pid = fork()) == -1)i4 /x and a process x/ 
close(pfp|O D; /x or dispose of pipe x/ 
close(pfp[1]; 
return NULL; 


/xx 一 -一 一 一 一 一 -一 一 一 一 一 一 parent code here --—-—-—-—---------—-——-— x/ 


/* need to close one end and fdopen other end x/ 


if ( pid > 0 ){ 
if (close( pfp[child end] ) == -1) 
return NULL; 
return fdopen( pfp[parent end] , mode);/* same mode */ 





/* --------------- child code here 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 x/ 


/* need to redirect stdin or stdout then exec the cmd «/ 


if ( close(pfp[| parent_end}) == - 1 )/* close the other end */ 
exit(1); /x do NOT return x/ 

if ( dup2(pfp[child end], child end) == -1) 
exit(1); 

if ( close(pfpl child end] == -1 ) /x done with this one x/ 
exit(1) ; 


/* all set to run cmd */ 
execl( "/bin/sh", "sh", "- c", command, NULL ); 


exit(1); 


该 版 本 的 popen 对 信和 号 不 做 任何 处 理 。 这 是 不 是 有 问题 ? 
11.4.3 访问 数据 : 文件 .应 用 程序 接口 (APH) 和 和 服务 器 


fopen 从 文件 获得 数据 ,而 popen 从 进程 获得 数据 。 这 里 主要 关注 一 下 数据 访问 的 普遍 
问题 并 对 三 种 实现 方法 进行 比较 。 将 以 获取 登录 系统 的 用 户 列表 为 例 来 比较 三 种 访问 数据 
的 方法 。 

”方法 1: 从 文件 获取 数据 

可 以 通过 读 取 文 件 来 获取 数据 。 第 2 章 所 写 的 who 程序 就 是 从 utmp 文件 中 读 取 数据 的 。 
基于 文件 的 信息 服务 并 不 是 很 完美 。 客 户 端 程序 依赖 于 特定 的 文件 格式 和 结构 体 中 的 特定 成 
员 名 称 。 下 面 的 Linux 头 文件 定义 中 utmp 结构 体 的 几 行 代码 清楚 地 展示 了 这 一 点 。 


/*Backwards compatibility hacks. */ 


# define ut name ut user 
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。 方法 2: 从 函数 获取 数据 

可 以 通过 调用 函数 来 得 到 数据 。 一 个 库 函 数 用 标准 的 函数 接口 来 封装 数据 的 格式 和 
位 置 。Unix 提供 了 读 取 utmp 文件 的 函数 接口 getutent 的 帮助 信息 描述 了 读 取 utmp 数 
据 库 函 数 的 细节 。 这 样 的 话 ,就算 底层 的 存储 结构 变化 了 ,使 用 这 个 接口 的 程序 仍 能 正常 
TYE. 

使 用 基于 应 用 程序 接口 (API) 的 信息 服务 也 并 不 一 定 是 最 好 的 方法 。 有 两 种 方法 可 
以 使 用 库 函 数 。 一 个 程序 可 以 使 用 静态 连接 来 包含 实际 的 函数 代码 。 但 是 这 些 函 数 有 可 
能 包含 的 并 不 是 正确 的 文件 名 或 文件 格式 。 另 一 方面 ,一 个 程序 可 以 调用 共享 库 中 的 画 
数 , 但 是 这 些 共 享 库 也 并 不 是 安装 在 所 有 的 系统 上 ,或 者 其 版 本 并 不 是 程序 所 要 使 用 的 
版 本 。 

。 方法 3: 从 进程 获取 数据 

第 三 种 方法 是 从 进程 中 读 取 数据 。bc/dc 和 popen 例子 显示 了 如 何 创 建 一 个 进程 到 另 
外 一 个 进程 的 连接 。 一 个 要 得 到 用 户 列表 的 程序 可 以 使 用 popen 来 建立 与 who 程序 的 连 
BE. BH who 命令 来 负责 使 用 正确 的 文件 名 和 文件 格式 以 及 正确 的 库 函 数 ,而 不 是 你 的 程序 。 

调用 独立 的 程序 获得 数据 还 有 其 他 的 好 处 。 服 务 器 程序 可 以 使 用 任何 程序 设计 语言 
i: shell 脚本 、C Java 或 是 Perl 都 可 以 。- 以 独立 程序 的 方式 实现 系统 服务 的 最 大 好 处 是 客 
户 端 程序 和 服务 器 端 程序 可 以 运行 在 不 同 的 机 器 上 。 所 有 要 做 的 只 是 和 不 同 机 器 上 的 一 
进程 相连 接 。 


11.5 socket: 与 远 端 进程 相连 


管道 使 得 进程 向 其 他 进程 发 送 数据 就 像 向 文件 发 送 数据 一 样 容易 ,但 是 管道 具有 两 
个 重大 的 缺陷。 管道 在 一 个 进程 中 被 创建 ,通过 fork 来 实现 共享 。 因 此 ,管道 只 能 连接 相 
关 的 进程 ,也 只 能 连接 同一 台 主 机 上 的 进程 。Unix 提供 了 另外 一 种 进程 间 的 通信 机 制 
socket, 
socket 允许 在 不 相关 的 进程 间 创 建 类 似 管 道 的 连接 ,甚至 可 以 通过 socket 连接 其 他 主 
机 上 的 进程 (如 图 11. 7 所 示 )。 本 节 将 学 习 socket 的 基础 知识 ,理解 如 何 用 socket 连接 不 同 
主机 上 的 客户 端 和 服务 器 端 。 其 思想 就 跟 打 电话 查询 当地 时 间 一 样 简单 。 








图 11.7 连接 到 远 端的 进程 
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11.5.1 类 比 :“ 电 话 中 传 来 声音 : 现在 时 间 是 ……” 


许多 城市 都 设 有 提供 时 间 服 务 的 电话 号 码 。 只 要 拨打 该 号 码 , 机 融 将 负责 告诉 你 该 城 
市 的 时 间 。 它 是 如 何 工 作 的 呢 ? 如 果 想 建立 目 己 的 时 间 服 务 , 该 如 何 做 呢 ? 可 以 采用 图 11. 
8 中 所 描述 的 比较 简单 的 方法 。 你 坐 在 办 公 室 里 ,将 一 个 钟 挂 在 墙 上 来 扮演 提供 时 间 服 务 的 
服务 器 。 你 所 要 遵循 的 步 又 和 Unix 中 基于 socket 建立 时 间 服 务 器 的 步骤 完全 一 致 。 下 面 ， 
将 详细 讨论 这 些 步 又. 








建立 服务 
找到 电话 等 待 请 求 
“a 盖 接收 请 求 
获得 数据 发 送 数据 
tE 挂 断 


图 11.8 时 间 服 务 


l. 建立 服务 及 与 服务 相关 的 操作 

一 旦 买好 并 安装 了 你 自己 的 时 钟 ,如何 建立 和 操作 时 间 服 务 器 呢 ? 

(1) 建立 服务 

建立 服务 包含 以 下 3 NER. 

。 获取 一 根 电话 线 

自 先 ,需要 一 根 接 自 公 用 电话 网 上 的 电话 线 来 连接 办 公 桌 旁 墙 上 的 插座 。 该 电话 线 和 
插座 使 你 可 以 连接 到 电话 网 上 , 接 下 来 外 面 的 呼叫 可 以 被 传送 到 你 的 办 公 桌 。 这 里 的 插座 
通常 被 称 为 通信 端点 (endpoint of communication) 。 下 一 次 如 果 需 要 在 家 里 安装 电话 线 , 可 
以 回电 话 局 申请 安装 一 个 通信 端点 。 

。 为 电话 线 申请 号 码 

客户 端 需要 通过 呼叫 一 个 电话 号 码 连接 到 你 的 通信 端点 。 电 话 网 络 以 电话 号 码 来 区 分 
每 个 墙 上 的 插座 。 从 这 个 类 比 本 身 考 虑 ,设想 你 是 在 一 个 大 的 商务 系统 中 ,除了 时 间 服 务 以 
外 还 需 提 供 其 他 的 服务 。 因 此 ,每 个 插座 要 以 电话 号 码 附 加 二 个 分 机 号 码 来 标识 。 

例如 : 你 的 号 码 可 能 是 617 一 999 一 1234, 分 机 号 码 是 8080, 电话 号 码 标识 了 你 的 办 公 室 
所 在 的 大 楼 的 号 码 ,扩展 号 码 8080 标识 了 该 楼 中 每 个 具体 的 电话 ， 一 个 号 码 来 标识 大 楼 ,一 
个 分 机 号 码 来 标识 你 的 服务 ,这 是 一 个 重要 的 机 制 。 

。 处 理 接 人 电话 

你 可 能 使 用 的 是 无 来 电 显示 的 电话 。 你 的 服务 不 需要 上 述 类 型 的 电话 服务 。 但 必须 通 
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知 电话 网 络 让 你 的 电话 线 可 以 接收 接 入 呼叫 。 你 可 以 为 接 入 呼叫 设置 一 个 队列 ,并 用 一 条 
消息 来 提示 拨打 者 对 你 来 说 他 们 呼叫 的 重要 程度 ,然后 播放 一 段 音 乐 。 在 socket 中 也 使 用 
了 队列 的 思想 ,当然 不 会 播放 音乐 。 

(2) 与 服务 相关 的 操作 

与 时 间 服 务 相 关 的 操作 是 包含 以 下 3 个 步 又 的 一 个 循环 。 

。 等待 呼叫 

等 待 在 那儿 ,不 做 任何 事情 直到 有 呼叫 进来 。 从 技术 的 角度 讲 , 即 被 阻塞 在 一 个 呼叫 
上 。 当 一 个 呼叫 进来 ,你 解除 阻塞 并 接收 呼叫 。 

。 提供 服务 

在 这 个 例子 中 ,你 看 一 下 钟 ,然后 通过 电话 线 把 时 间 告 诉 对 方 。 

。 挂 断 

已 经 完成 了 对 该 呼叫 的 工作 , 挂 断 电 话 。 

ERR 6 个 步骤 中 ,3 个 用 来 建立 服务 ,3 个 用 来 对 应 每 个 接 人 呼叫 。 这 6 个 步骤 就 是 对 在 
电话 网 上 运行 时 间 服 务 的 详细 描述 。 

2. 使 用 服务 

客户 端 如 何 使 用 所 提供 的 服务 呢 ? 每 个 客户 端 都 遵循 以 下 4 个 步骤 。 

(1) 获取 一 根 电话 线 

客户 端 同样 需要 一 个 通信 端点 。 客 户 端 还 要 从 电话 网 络 申请 一 个 电话 号 码 。 

(2) 连接 到 具体 号 码 

客户 端 使 用 这 根 电 话 线 向 电话 网 络 请 求 建立 一 个 到 特定 线路 的 连接 。 客 户 端 拨打 大 
楼 的 电话 及 你 办 公 室 的 分 机 ,并 与 其 相连 。 其 中 的 商务 楼 的 号 码 和 分 机 号 码 的 组 合 被 称 
为 服务 的 网 络 地 址 。 从 技术 的 角度 讲 , 商 务 楼 号 码 是 主机 地 址 ,分 机 号 码 是 端口 号 或 者 称 
为 端口 。 在 前 面 的 例子 中 ,主机 号 是 617 一 999--1234 ,端口 是 8080。 

(3) 使 用 服务 

两 个 通信 端点 (客户 端的 和 服务 器 端的 ) 现 在 已 经 建立 了 连接 。 任 何 一 方 可 以 通过 该 连 
接 向 另外 的 通信 端点 发 送 数据 。 以 时 间 服 务 器 为 例 , 服 务 器 通过 线路 发 送 数据 ,而 客户 端 则 
接收 信息 。 像 目录 编排 这 样 更 加 复杂 的 服务 就 需要 服务 器 和 客户 端 之 间 更 复杂 的 交互 。 本 
书 在 后 面 将 分 析 更 复杂 的 服务 。 

(4) 挂 断 电话 

交互 已 经 完成 。 客 户 端 可 以 挂 断 电话 。 

3. 重要 概念 

时 间 服 务 器 例子 包含 了 socket 编程 中 所 要 涉及 的 4 个 重要 的 概念 。 

(1) 客户 和 服务 器 

已 经 不 止 一 次 地 讨论 该 问题 了 。 服 务 器 是 提供 服务 的 程序 。 在 Unix 中 ,服务 器 是 一 个 
程序 不 是 一 台 计 算 机 。 服 务 器 进程 等 待 请 求 , 处 理 请 求 , 然 后 循环 回去 等 待 下 一 个 请 求 。 客 
户 端 进程 则 不 需要 循环 , 它 只 需 建立 一 个 连接 ,与 服务 器 交换 数据 ,然后 继续 自己 的 工作 。 

(2) 主机 名 和 端口 

运行 于 因特网 上 的 服务 器 其 实 是 某 台 计算 机 上 运行 的 一 个 进程 。 这 里 计算 机 被 称 为 主 
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机 。 机 器 通常 被 指定 一 个 名 字 如 sales. xyzcorp. com, 这 被 称 为 该 主机 的 名 字 。 服 务 器 在 该 
主机 上 拥有 一 个 端口 。 主 机 和 端口 的 组 合 才 标识 了 一 个 服务 器 。 

(3) 地 址 族 

你 的 时 间 服 务必 须 拥 有 一 个 电话 号 码 , 它 还 可 能 有 街道 地 址 和 邮编 ,其 至 可 能 有 经 度 和 
纬度 或 是 其 他 集合 的 数据 等 属性 。 上 述 每 个 集合 的 数据 都 是 你 的 服务 的 地 址 。 但 是 如 用 经 
度 和 纬度 来 代替 电话 号 码 中 的 电话 号 码 和 扩展 号 码 的 话 , 它 们 有 可 能 不 能 正常 运作 。 

上 面 的 每 个 地 址 分 别 属于 不 同 的 地 址 族 。 电 话 号 码 和 分 机 号 码 是 电话 网 络 地 址 族 的 地 
址 ,这 里 可 以 用 AF_PHONE 来 标识 。 类 似 地 ,经 度 和 纬度 在 全 球 坐 标 系 统 地 址 族 中 才 有 意 
义 , 并 可 以 用 AF_GLOBAL 来 标识 。 

(4) 协议 

协议 是 服务 器 和 客户 之 间 交 互 的 规则 。 在 时 间 服 务 器 的 例子 中 ,协议 很 简单 : Pf 
叫 ,服务 器 回答 ,给 出 时 间 信 息 后 挂 断 。 

如 有 果 运 行 的 是 一 个 查 号 辅助 服务 ,又 将 如 何 呢 ?协议 将 会 复杂 一 点 。 服 务 器 需要 回 
答 和 发 送 初 始 欢迎 信息 (例如 :“ 欢 迎 访问 查 号 辅助 系统 ,请 问 您 在 哪个 城市 ?”)。 客 户 端 
给 出 城市 的 名 字 后 ,服务 器 将 询问 所 查 名 字 ( 例 如 ;“ 您 需要 查询 什么 ?”)。 客 户 端 以 某 公 
司 或 个 人 的 名 字 作 应 答 。 这 时 服务 器 给 出 所 要 请 求 的 电话 号 码 或 此 城市 不 存在 所 查询 的 
名 字 的 消息 。 一 些 查 号 辅助 服务 器 还 提供 付费 的 电话 服务 。 消 息 的 交互 遵循 查 号 辅助 协 
X (directory — assistance protocol) ,本 章 称 其 为 DAP。 每 个 客户 /服务 器 模型 都 必须 定义 这 
样 一 个 协议 。 


11.5.2 因特网 时 间 、DAP 和 天 气 服务 器 


时 间 上 服务 器 和 查 号 辅助 服务 器 的 例子 不 仅仅 是 用 于 教学 的 比喻 ,它们 在 因特网 中 存在 
着 广泛 的 应 用 。 试 一 下 下 面 的 命令 : 


$ telnet mit. edu 13 

Trying 18.7.21.69... 

Connected to mit. edu 

Escape character is '*]', 

Mon Aug 13 22;36;44 2001 
Conncetion closed by foreign host. 


$ 


位 于 MIT 的 某 台 主 机 上 有 一 台 时 间 服 务 器 , 它 在 13 号 端口 等 待 请 求 。 当 用 telnet 和 该 
服务 右 连 接 的 时 候 , 服 务 器 接收 请 求 ,检查 系统 时 钟 , 通 过 网 络 送 回 当 前 的 时 间 , 然 后 挂 断 连 
接 。 跟 前 面 的 时 间 服 务 的 例子 完全 相同 ,它们 甚至 使 用 了 相同 的 协议 。 试 一 下 连接 到 其 他 
主机 的 13 号 端口 。 可 以 得 到 世界 上 其 他 任何 机 器 上 的 时 间 。 

telnet 程序 就 像 一 部 电话 。 它 和 远 端 主机 的 某 个 端口 建立 连接 ,然后 把 你 键盘 上 的 输入 
数据 通过 连接 发 送出 去 ,并 将 通过 连接 接收 到 的 数据 显示 在 屏幕 上 

那 查 号 辅助 服务 又 如 何 呢 ? 查 号 辅助 服务 器 通常 在 79 号 端口 监听 。 例 如 ,交互 过 程 如 





下 所 示 : 
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$ telnet princeton. edu 79 
Trying 128.112.128.81... 


Connected to princeton. edu. 


Escape character is '^]'. 


Smith 
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name ; 
department. 
email. 
emailbox. 


netid t 


: 000012345 


Waldo Smith 

Special Student 

waldos(à Princeton. EDV 
waldos@mail. Princeton. EDU 


waldos 


name. 
department. 
email. 
emailbox. 


netid : 


: 000333333 


Ignatz E Smith 
Undergraduate Class of 1997 
ismith@ Princeton. EDU 
ismith@mail. Princeton. EDU 


ismith 





当 一 个 请 求 到 来 时 ,服务 器 接收 该 请 求 。 协 议 中 规定 了 客户 必须 输入 用 户 名 并 以 回 车 
结束 。 服 务 器 将 所 有 的 匹配 和 人 口传 回 ,然后 挂 断 连接 。 
天 气 服务 又 是 怎样 呢 ? 试 一 试 下 面 的 命令 ，; 


telnet rainmaker. wunderground. com 3000 


该 天 气 服务 的 协议 更 加 复杂 ,不 过 界面 却 友好 得 多 。 
11.5.3 服务 列表 : 众所周知 的 端口 


如 何 知道 端口 13 是 时 间 服 务 端口 而 79 是 目录 辅助 服务 呢 ? 同样 的 道理 ,在 美国 每 个 人 
都 知道 号 码 911 是 紧急 服务 ,号码 411 是 查 号 服务 ,这 些 就 是 众所周知 的 端口 。 在 文件 /ete/ 
services 中 定义 了 众所周知 服务 端口 号 的 列表 


S more /etc/services 

+ $ NetBSD; services, v 1.18 1996/03/26 00:07:58 mrg Exp $ 
it Network services, Internet style 

# 

# Note that it is presently the policy of IANA to assign a single 

4 well- known port number for both TCP and UDP;hence, most entries 
# here have two entries even if the protocol doesn't support UDP 


it operations. 
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# Updateed from RPC 1340, "Assigned Numbers"(July 1992). Not all 


it ports are included, only the more common ones. 


# 

H from: (@( + )services 5.8 (Berkeley) 5/9/91 
# 

tcpmux l/tcp # TCP port service multiplexer 

echo 7/tcp 

echo 7 /udp 

discard | 9/tcp sink null 

discard | 9/udp sink null 


systat ` 11/tcp users 
datetime 13/tcp 
datetime 13/udp 

—- more --— (13 % ) 


从 列表 中 可 以 看 出 时 间 服 务 是 端口 13。 仔 细 研 究 该 文件 可 以 看 到 因特网 主机 上 的 标准 
服务 ,如 ftp ,telnet finger 和 http 的 端口 。 

所 有 这 些 运 行 在 因特网 主机 上 的 服务 实际 上 都 是 基于 前 面 给 出 的 时 间 服 务 器 模型 的 思 
想 和 步骤 的 。 这 里 将 把 这 些 思 想 应 用 于 Unix 的 系统 调用 ,从 而 编写 自己 的 时 间 服 务 器 以 及 
7r PA vig HAS 


11.5.4 345 timeserv.c: 时 间 服 务 器 


上 面 提 到 的 基于 电话 的 时 间 服 务 涉及 6 个 步骤 。 每 个 步 又 与 一 个 系统 调用 相对 应 。 对 
应 关系 如 下 所 示 : 





行 为 系统 调用 

1. 获取 电话 线 socket 

2. 分 配 号 码 bind 

3. 允许 接 入 调用 listen 

4. 等 待 电 话 accept 

5. 传送 数据 | read/ write 
6. 挂 断 电话 close 

程序 如 下 : 


/* timeserv.c a socket ~ based time of day server 


*/ 


# include <stdio. h> 

# include <unistd. h> 

i include <(sys/types. h> 
# include <(sys/socket. h> 
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# include <netinet/in. h> 
# include <netdb. h> 

i include < time. h> 

# include <strings. h> 


# define PORTNUM 13000 /* our time service phone number */ 


# define HOSTLEN 256 


#define oops(msg) { perror(msg) ; exit(1) ; } 


int main(int ac, char x av[ ]) 


1 


/* 


* 


/* 


x 


/* 


* 


struct  sockaddr in  saddr; /* build our address here x/ 


struct  hostent * hp; /x this is part of our x/ 
char hostname| HOSTLEN | ; /* address x/ 
int SOoCk id,sock fd; /x line id, file desc x/ 
FILE * Sock fp; /* use socket as stream x/ 
char x ctime() ; /* convert secs to string x/ 
time t thetime; /* the time we report x/ 
Step 1; ask kernel for a socket 
/ 
SoCk id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x/ 
if ( sock id == -1) 

oops( "socket" ); 


Step 2; bind address to socket. Address is host, port 
/ 


bzero( (void x )&saddr, sizeof(saddr) ); /* clear out struct x/ 


gethostname( hostname, HOSTLEN ); /* where am I ? x/ 
hp = gethostbyname( hostname ); /* get info about host */ 
/* fill in host part x/ 
bcopy( (void x )hp- >h addr, (void * )&saddr.sin addr, 

hp ~ >h length); 
saddr.sin_port = htons(PORTNUM); /* fill in socket port */ 


saddr.sin family = AF INET ; /* fill in addr family x/ 


if ( bind(sock id, (struct sockaddr x )&saddr, sizeof(saddr)) 1= 0) 


oops( "bind" ); 


step 3; allow incoming calls with Qsize = 1 on socket 


343 


, EE 
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*/ 
if ( listen(sock id, 1) != 0) 
oops( "listen" ); 
/x 
x main loop; accept(), write(), close() 
*/ 
while ( 1 ){ 


sock fd = accept(sock_id, NULL, NULL); /x wait for call x/ 


printf( "Wow! got acall! \n"); 


if ( sock fd == -1) 

oops( "accept" ); /x error getting calls x/ 
Sock fp = fdopen(sock fd, "w"); /x we'll write to the x/ 
if ( sock fp -- NULL ) /* socket as a stream x/ 

oops( "fdopen" ); /* unless we can't x/ 
thetime = time(NULL); /x get time «/ 

/* and convert to strng x/ 

fprintf( sock fp, "The time here is .. " ); 


fprintf( sock fp, “ % s", ctime(&thetime) ); 


fclose( sock fp); /* release connection */ 


下 面 将 对 程序 如 何 工作 给 出 解释 。 

。 PFR 1. 向 内 核 申 请 一 个 socket 

socket 是 一 个 通信 端点 。 就 像 位 于 墙 上 的 电话 插座 一 样 ,socket 是 产生 呼叫 和 接收 呼叫 
的 地 方 。 系 统 调 用 socket 创建 一 个 socket, 

















socket 

目标 建立 一 个 socket 
头 文 件 # include < sys/types. h> 

# include «sys/socket. h> 
函数 原型 sockid — socket(int domain,int type,int protocol) 
参数 domain ”通信 域 

PF INET 用 于 Internet socket 

type socket 8928 HY, SOCK. STREAM JR £ 3B Ky 

protocol # i socket 中 所 用 的 协议 ,默认 为 0 
返回 值 一 ] 遇 到 错误 


sockid 成 功 返回 
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socket 调用 创建 一 个 通信 端点 并 返回 一 个 标识 符 。 有 很 多 种 类 型 的 通信 系统 ,每 个 被 称 
为 一 个 通信 域 。Internet 本 身 就 是 一 个 域 。 在 后 面 会 看 到 Unix 内 核 是 另 一 个 域 。Linux X 
持 好 几 个 其 他 域 的 通信 。 

socket 的 类 型 指出 了 程序 将 要 使 用 的 数据 流 类 型 。SOCK_STRAEAM 类 型 跟 双向 的 
管道 类 似 。 数 据 作 为 连续 的 字 节 流 从 一 端 写 人 ,再 从 另 一 端 读 出 。 后 面 的 章节 中 将 介绍 
SOCK DGRAM 类 型 。 | 

PR CP EUG AY ZS BX protocol 指 的 是 内 核 中 网 络 代码 所 使 用 的 协议 ,并 不 是 客户 端 和 服务 
船 之 间 的 协议 。 一 个 为 0 的 值 代表 选择 标准 的 协议 。 

。 步骤 2: 绑 定 地 址 到 socket 上 ,地址 包括 主机 .端口 

下 一 个 步骤 是 把 一 个 网 络 地 址 分 配给 socket。 在 Internet 域 中 ,地 址 由 主机 和 端口 构 
成 。 这 里 不 能 使 用 端 日 13, 因为 该 端口 已 经 为 时 间 服 务 器 保留 。 这 里 可 使 用 端口 13000 
来 代替 。 可 以 为 你 的 服务 器 端口 选择 任意 的 号 码 , 只 是 该 号 码 不 要 太 小 且 不 能 已 经 被 占 
用 。 低 端口 号 可 能 已 经 被 系统 服务 所 占用 ,而 不 能 再 被 普通 用 户 使 用 。 请 检查 系统 中 端 
口 的 限制 范围 。 端 口号 是 一 个 16 位 的 数值 ,所 以 有 很 多 端口 号 可 用 。 系 统 调 用 bind 如 下 
AT AR 。 





bind 





EE: 绑 定 一 个 地 址 到 socket 
头 文 件 # include « sys/types. h> 
# include « sys/socket. h> 
be Bt E result= bind(int sockid, struct sockaddr x addrp, socklen_t addrlen) 
参数 sockid socket 的 id 


addrp 指向 包含 地 址 结构 的 指针 
addrlen ”地 址 长 度 

返回 值 —] 过 到 错误 
0 成 功 





bind 调用 把 一 个 地 址 分 配给 socket。 该 地 址 的 分 配 就 类 似 于 把 一 个 电话 号 码 分 配给 墙 
上 的 一 个 插座 ; 当 进 程 要 与 服务 器 连接 的 时 候 , 它 们 就 使 用 该 地 址 。 每 个 地 址 族 都 有 自己 的 
格式 。 因 特 网 地 址 族 (AF_INET) 使 用 主机 和 端口 来 标志 。 地 址 就 是 一 个 以 主机 和 端口 为 成 
员 的 结构 体 。 自 己 写 的 程序 应 首先 初始 化 该 结构 的 成 员 , 然 后 再 填充 具体 的 主机 地 址 和 端 
口号 ,最 后 填充 地 址 族 。 关 于 建立 上 述 数 据 的 具体 函数 ,可 参阅 帮助 手册 。 

当 所 有 的 部 分 被 填充 了 之 后 ,地 址 已 经 被 绑 定 到 该 socket 上 。 其 他 类 型 的 socket 会 使 
用 包含 不 同 成 员 的 地 址 。 

“步骤 3: 在 socket 上 ,人 允许 接 入 呼叫 并 设置 队列 长 度 为 1 

服务 器 接收 接 入 的 呼叫 ,所 以 这 里 的 程序 必须 使 用 listen, 


—————————Ó 'á— ep —— dolo RE —— ——— À—— — À—— 
armaa acer reer PME E 
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listen 











目标 监听 socket 上 的 连接 
头 文件 + include « sys/socket. h> 
EE SEL E. result = listen(int sockid,int qsize) 
参数 sockid 接收 请 求 的 socket 
qsize 允许 接 人 连接 的 数目 
返回 值 —1 遇 到 错误 
0 成 功 


listen 请 求 内 核 允许 指定 的 socket 接收 接 人 呼叫 。 并 不 是 所 用 类 型 的 socket 都 能 接收 
接 人 呼叫 。 但 SOCK_STREAM 类 型 是 可 以 的 。 第 二 个 参数 指出 接收 队列 的 长 度 。 在 本 章 
的 程序 中 请 求 的 是 一 个 长 度 为 1 的 队列 。 队 列 最 大 长 度 则 取决 于 具体 socket 的 实现 。 

。 步骤 4: 等 待 /接收 呼叫 

一 旦 socket 被 建立 并 被 分 配 一 个 地 址 ,而 且 准 备 等 待 接收 呼叫 ,程序 即将 开始 工作 。 服 
务 器 等 待 直到 呼叫 到 来 。 它 使 用 系统 调用 accept 来 接收 调用 。 











accept 
目标 接收 socket 上 的 一 个 连接 
头 文 件 # include < sys/types. h> 
& include «sys/socket. h> 
函数 原型 fd=accept(int sockid,struct sockaddr * callerid,socklen t x addrlenp) 
参数 sockid 接收 该 socket 上 的 呼叫 


callerid — f& [s] EF n] d Be EE FJ E TR T 

addrlenp #8 [n] AY AY zi Hb bt £5 F4 te BE B9 38 £F 
返回 值 一 1 遇 到 错误 

fd 用 于 读 写 的 文件 描述 符 


accept 阻塞 当前 进程 ,一 直到 指定 socket 上 的 接 入 连接 被 建立 起 来 ,然后 accept 将 返回 
MPP BEAT ,并 用 该 文件 描述 符 来 进行 读 写 操 作 。 此 文件 描述 符 实 际 上 是 连 旬 呼叫 进程 的 
某 个 文件 描述 符 的 一 个 连接 。 

accept 文 持 一 种 类 型 的 呼叫 者 的 ID。 在 呼叫 发 起 者 一 边 ,socket 有 自己 的 地 址 ,例如 对 
于 因特网 连接 ,地 址 就 是 主机 地 址 和 端口 号 。 如 果 callerid 和 addrlenp 指针 不 为 空 的 话 , 内 
核 将 把 呼叫 者 地 址 填充 到 callerid 所 指向 的 结构 中 ,并 把 该 结构 的 长 度 填 充 到 addrlenp 所 指 
加 的 内 存单 元 中 。 

就 像 人 们 使 用 来 电 显示 的 信息 来 决定 如 何 处 理 打 入 的 电话 一 样 ,一 个 网 络 程序 可 以 使 
用 呼叫 进程 的 地 址 来 决定 如 何 处 理 该 连接 。 

© EUR 5i 传输 数据 

accept 调用 所 返回 的 文件 描述 符 是 一 个 普通 文件 的 描述 符 。 对 它 的 操作 从 第 2 章 中 学 
?]56 open 调用 之 后 一 直 在 使 用 。 程 序 timeserv. c 用 fdopen 将 文件 描述 符 定向 到 缓存 的 数 
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据 流 ,以 便于 使 用 fprintf 调用 来 进行 输出 。 在 以 前 只 能 使 用 write 来 完成 这 项 工作 。 
。 步骤 6: 关闭 连接 
accept 所 返回 的 文件 摘 述 符 可 以 由 标准 的 系统 调用 close 关闭 。 当 一 端的 进程 关闭 了 该 
端的 socket, 在 另 一 端的 进程 在 试图 读数 据 的 话 , 它 将 得 到 文件 结束 标记 。 这 中 管道 的 工作 
原理 类 似 。 


11.5.5 测试 timeserv. c 
下 面 可 以 编译 并 运行 时 间 服 务 器 ， 


$ cc timeserv.c - o timeserv 
$ timeserw& 
29362 


$ 


启动 服务 以 “&.” 符 号 结尾 ,所 以 shell 将 运行 它 但 不 调用 wait 调用 。 服 务 将 阻塞 在 
accept 调用 上 。 这 里 可 以 用 telnet 连接 到 服务 器 上 : 


$ telnet 'hostname' 13000 

Trying 123.123.123.123 

Connected to somesite. net 

Escape character is '^]'. 

Wow! got a call! 

The time here is .. Tue Aug 14 11:36:30 2001 
Connection close by foreign host. 

s 

$ telnet 'hostname' 13000 

Trying 123.123.123.123 

Connected to somesite. net 

Escape character is '^]'. 

Wow! got a call! 

The time here is .. Tue Aug 14 11:36:53 2001 
Connection close by foreign host. 


$ 


上 面 的 程序 建立 了 两 个 连接 ,并 且 服 务 器 响应 了 每 个 连接 。 服务 器 将 持续 运 运行 ,直到 使 
用 kill 命令 来 结束 其 运行 。 


$ kill 29362 


对 于 此 服务 器 而 言 ,telnet 程序 是 其 客户 。 但 它 并 不 总 是 适合 连接 到 任何 服务 器 上 的 。 
这 里 将 针对 该 服务 器 编写 一 个 特殊 的 客户 端 程序 。 


11.5.6 编写 timeclnt. c: 时 间 服 务 客户 端 
基于 电话 的 时 间 服 务 客户 端的 实现 包含 4 个 步骤 ,每 个 步骤 对 应 一 个 系统 调用 。 
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行 “为 | 系统 调用 
1. 获取 一 根 电 话 线 socket 
2. 呼叫 服务 器 connect 
3. 传送 数据 | read/ write 
4. 挂 断 电话 close 





下 面 是 这 个 程序 : 


/* timeclnt.c ~ a client for timeserv.c 


x usage. timeclnt hostname portnumber 
" 

# include <stdio.h> 

| #include <sys/types.h> 

# include  «sys/socket. h 

# include <(netinet/in. h> 

# include <cnetdb. h> 


# define oops(msg) { perror(msg); exit(1); } 


main(int ac, char x av[ ]) 


1 


struct sockaddr in servadd; /* the number to call x/ 
struct hostent x hp; /* used to get number */ 
int | sock id, sock fd; /* the socket and fd */ 
char messagel BUFSIZ |; /x to receive message x/ 
int messlen; /* for message length x/ 
/* 
x Step 1; Get a socket 
x/ 
Sock id = socket( AF INET, SOCK STREAM, 0 ); /x get a line x/ 
if ( sock id == -1) 
oops( "socket" ); /* or fail x/ 
/* 
* Step 2 ; connect to server 
x need to build address (host,port) of server first 
*/ 


bzero( &servadd, sizeof( servadd ) ); /* zero the address x/ 


hp = gethostbyname( av[1] ); /* lookup hosts ip # x/ 
if (hp == NULL) 
oops(av[1 p; /* or die x/ 


bcopy(hp- >>h_addr, (struct sockaddr x )&servadd. Sin addr, 
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hp- >h length) ; 
servadd.sin port = htons(atoi(av|2])); /x fill in port number «/ 


servadd.sin family - AF INET ; /* fill in socket type x/ 
/x now dial */ 
if ( connect(sock id,(struct sockaddr * )&servadd, 


sizeof(servadd)) ! = 0) 


oops( "connect" ); 


/* 
* Step 3, transfer data from server, then hangup 


*/ 


messlen = read(sock id, message, BUFSIZ); /* read stuff x/ 
if ( messlen == - 1) 
oops("read") ， 
if ( write( 1, message, messlen ) ! = messlen ) /x and write to */ 
oops( "write" ); /* stdout x/ 
close( sock id); 


下 面 是 对 该 程序 的 解释 。 

© 步骤 1: 向 内 核 请 求 建立 socket 

客户 端 需 要 一 个 socket 跟 网 络 相 连 ,就 像 时 间 服 务 中 的 客户 端 需要 一 条 电话 线 跟 电话 
网 络 相 连 一 样 。 客 户 端 必须 建立 Internet $R (AF_INET) socket, 并且 它 还 必须 是 流 socket 
(SOCK STREAMD, 

。 步骤 2: 与 服务 器 相连 

客户 端 需要 连接 到 时 间 服 务 器 。connect 系统 调用 的 作用 实际 上 与 打 电 话 类 似 。 

















connect 
目标 连接 到 socket 
头 文件 # include «sys/types. h> 
# include < sys/socket, h> 
函数 原型 result=connect(int sockid, struct sockaddr * serv addrp, socklen. t addrlen) ; 
参数 sockid 用 于 建立 连接 的 socket 
serv_addrp 指向 服务 器 地 址 结构 的 指针 
addrlen 结构 的 长 度 
返回 值 —1 过 到 错误 
00 成 功 





connect 调用 试图 把 由 sockid 所 标识 的 socket 和 由 serv_addrp 所 指向 的 socket 地 址 相 
连接 。 如 果 连 接 成 功 的 话 ,connect 3l [ul 0, 而 此 时 ,sockid 是 一 个 合法 的 文件 描述 符 , 可 以 
用 来 进行 读 写 操作 。 写 入 该 文件 描述 符 的 数据 被 发 送 到 连接 的 另 一 端的 socket, 而 从 另 一 端 
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写 入 的 数据 将 从 该 文件 描述 符 读 取 。 

。 步骤 3 和 4: 传送 数据 和 挂 断 

在 成 功 连接 之 后 ,进程 可 以 从 该 文件 描述 符 读 写 数据 ,就 像 与 普通 的 文件 或 管道 相连 接 
一 样 。 在 时 间 服 务 的 客户 /服务 器 例子 中 ,timeclnt 只 是 从 服务 器 读 取 一 行 数据 。 

读 取 时 间 之 后 ,客户 端 关 闭 文件 描述 符 然后 退出 。 若 客户 端 退 出 而 不 关闭 描述 符 , 内 核 
将 完成 关闭 文件 描述 符 的 任务 。 


11.5.7 测试 timeclnt. c 


大 家 已 经 有 好 几 页 没有 看 到 插图 了 ,大 概 已 经 忘记 这 些 代码 的 任务 了 吧 。 图 11. 9 将 
会 提醒 我 们 。 服 务 器 进程 运行 在 一 台 机 器 上 ,而 客户 端 程序 在 另 一 台 机 器 上 通过 网 络 与 
服务 器 连接 。 服 务 器 通过 write 调用 来 发 送 数据 ,客户 端 通过 read 调用 来 接收 消息 。 


客户 AR eer 





图 11.9 位 于 不 同 机 器 上 的 进程 


对 上 面 这 段 代 码 真实 的 测试 需要 在 不 同 机 器 上 运行 这 两 个 程序 。 我 不 太 确 定 下 面 写 在 
书 上 的 测试 情况 是 否 足 够 明确 ,不 过 大 家 可 以 作为 参考 : 


$ hostname # 检 查 当 前 机 器 
computerl.mysite.net # 第 一 台 机 器 

$ cc timeserv.c - o timeserv # 建 立 服务 器 

$ ./timeserv& ## 并 运行 它 

[1] 10739 

$ 

$ scp timeclnt.c bruce@computer2 ; # 发 送 客户 代码 到 另 一 台 机 器 
bruce@computer2’s password, 

timeclnt.c | 1KB | 1.8KB/s |ETA; 00:00:00 |100 € 


$ ssh bruce@computer2 

bruce@computer2’s password, 

No mail. 

computer2;bruces cc timeclnt.c - o timeclnt 
computer2;bruce $,/timeclnt computer1 13000 Wow! Got a call! 
The time here is ..Tue Aug 14 02:44,31 2001 


Computer2 :bruces 
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服务 器 编译 好 后 ,运行 在 机 器 1 上 。 然 后 把 客户 端 程序 复制 到 机 器 2 上 ,再 登录 到 机 器 
2。 在 机 器 2 上 ,编译 好 客户 端 后 ,然后 让 客户 端 请 求 与 运行 在 机 器 1 上 监听 在 13 000 端口 
的 服务 器 相连 接 。 这 里 看 到 的 消息 就 是 从 机 器 1 上 的 服务 器 通过 网 络 发 送 给 机 器 2 上 的 客 
户 的 。 而 客户 再 把 消息 发 送 至 标准 输出 。 

从 上 面 的 测试 结果 是 否 能 真 的 看 到 机 器 2 上 的 输出 ? 我 是 从 机 器 1 连接 到 机 器 2 的 ,所 
以 显示 消息 的 终端 实际 上 是 连接 到 机 器 1 上 的 。 后 面 的 一 些 练习 会 让 你 仔细 考虑 其 运作 
原理 。 | 
通过 timeserv/timeclnt 程序 ,可 以 得 到 另 一 台 机 器 上 的 时 间 。 检查 另 一 台 机 器 上 的 时 
间 可 以 保证 不 同 机 器 的 时 钟 同步 。 网 络 上 的 某 台 机 器 可 以 作为 权威 时 间 服 务 器 ,而 其 他 的 
机 器 可 以 利用 上 面 的 程序 周期 性 地 来 调整 自己 的 时 钟 。 


11.5.8 为 一 种 服务 器 : 远程 的 ls 


下 一 个 项 目 是 编写 一 个 可 以 打印 远 端 机 器 上 文件 列表 的 程序 。 你 可 能 在 两 台 机 器 上 拥 
有 账号 。 若 想 看 另 一 台 机 器 上 的 文件 列表 时 如 何 去 做 呢 ? 可 以 登录 到 另 一 台 机 器 上 ,然后 
运行 lg。 一 个 快速 的 且 更 加 方便 的 途径 是 运行 一 个 远程 的 ls 程序 ,这 里 称 它 为 rls (remote 
s) 。 可 以 指定 主机 名 和 目录 


$ rls computer2.site.net /home/me/code 


当然 ,rls 需要 在 另 一 台 机 器 上 的 一 个 服务 进程 接收 请 求 , 处 理 请 求 和 返回 结果 。 该 系统 
看 上 去 类 似 于 图 11. 10。 服 务 器 运行 在 一 台 机 器 上 ,客户 运行 在 另 一 台 机 器 上 并 与 服务 器 连 
接 ,把 目录 的 名 字 发 送 给 服务 器 。 服务 器 将 位 于 该 目录 下 的 文件 列表 信息 返回 给 客户 端 。 
客户 端 将 结果 送 至 标准 输出 把 它们 显示 出 来 。 两 进 程 系统 提供 了 对 于 不 同 机 器 上 的 目录 访 
问 的 支持 。 


sockets 





图 11.10 一 个 远 端的 ls 系统 
l. 设计 远程 ls 系统 
这 里 需要 3 个 要 素来 实现 rls RH. 
(1) 协议 
(2) 客户 端 程序 
(3) 服务 器 端 程序 
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2. 协议 
协议 包含 有 请 求 和 应 答 。 首 先 ,客户 端 发 送 一 行 包 含有 目录 名 称 的 请 求 。 服 务 器 读 取 
该 目录 名 之 后 打开 并 读 取 该 目录 ,然后 把 文件 列表 发 送 到 客户 端 。 客 户 端 循环 地 读 取 文件 
列表 ,直到 服务 器 挂 断 连接 产生 文件 结尾 标志 。 
3. BP sm: rls 
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/* rls.c - aclient for a remote directory listing service 


usage, rls hostname directory 


ffinclude <stdio.h> 

4 include <sys/types.h> 

# include < sys/socket. h> 

# include <netinet/in. h> 

# include <cnetdb. h> 

# define oops(msg) { perror(msg); exit(1); } 
# define PORTNUM 15000 


main(int ac, char x avf ]) 


{ 


struct sockaddr_in servadd; 
struct hostent * hp; 
int sock_id, sock_fd; 
char buffer| BUFSIZ |; 


int n read; 


if Cac != 3) exit(1); 


/** Step 1; Get a socket x x/ 


sock_id = socket( AF INET, SOCK STREAM, 0 ); 


if (sock id == -1) 


oops( "socket" ); 


/* * Step 2; connect to server * x/ 


bzero( &servadd, sizeof(servadd) ); 
hp = gethostbyname( av[1] ); 
if (hp == NULL) 

oops(av[1]); 


/x the number to call x/ 
/* used to get number x/ 
/* the socket and fd x/ 

/* to receive message x/ 


/* for message length x/ 


/x get a line x/ 


/x or fail x/ 


/* zero the address  x/ 


/x lookup host's ip + x/ 


/* or die x/ 


bcopy(hp - >h addr, (struct sockaddr x )&servadd. sin addr, hp- —h length); 


servadd.sin port - htons(PORTNUM); 
servadd.sin family = AF INET ， 


/* fill in port number x/ 


/* fill in socket type «/ 


if ( connect(sock id,(struct sockaddr x )&servadd, sizeof(servadd)) ! = 0) 


oops( "connect" ); 


/* * Step 3; send directory name, then read back results x x/ 
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if ( write(sock id, av[2], strlen(av[2])) == -1) 
oops( "write"); 
if ( write(sock id, "An", 1) == -1) 
oops("write") ; 
while( (n read = read(sock id, buffer, BUFSIZ)) > 0) 
if ( write(1, buffer, n read) == -1) 
oops( "write"); 
close( sock id); 


j 


注意 该 客户 端 与 时 间 服 务 客户 端的 不 同 之 处 。rls 客户 端 首先 把 目录 名 写 到 socket 中 。 
上 面 的 协议 规定 了 客户 端 每 次 发 送 一 行 , 因 此 程序 中 在 行 尾 增加 一 个 换行 符 。 接 下 来 ,客户 
端 进入 一 个 循环 ,将 从 socket 所 接收 的 数据 复制 到 标准 输出 ,直到 接收 到 文件 结尾 标志 。 
rls. c 使 用 低级 别 的 write 和 read 调用 来 和 服务 器 交换 数据 。 循 环 中 用 到 了 标准 大 小 的 缓存 
以 提高 效率 。 下 面 将 编写 服务 器 端的 程序 。 

4. 服务 器 程序 : rlsd 

服务 句 必 须 得 到 一 个 socket, 然 后 调用 bind, listen 命令 ,最 后 调用 accept 来 接收 一 次 呼 
叫 。 在 接收 呼叫 之 后 ,服务 器 从 socket 读 取 目录 名 ,然后 列 出 该 目录 下 的 内 容 。 服 务 器 是 如 
何 给 出 文件 列表 的 呢 ? 这 里 可 以 把 第 3 章 写 的 ls 程序 复制 过 来 ,但 也 可 以 用 一 个 更 简单 的 
方法 : 仅仅 使 用 popen 读 取 常规 版 本 的 1s 程序 的 输出 ,如 图 11. 11 所 示 。 


客户 服务 器 





Is 输出 
图 11.11 使 用 popen"ls" 来 显示 远 端 目录 


下 面 的 代码 中 使 用 了 popen: 


/* rlsd.c — a remote ls server - with paranoia 
x/ 

i include <stdio.h> 

# include <unistd.h> 

# include <sys/types.h> 

# include < sys/socket. h> 

H+ include <netinet/in. h> 
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# include <cnetdb. h> 
# include <(time. h> 
# include «strings. h> 


# define PORTNUM 15000 
i define HOSTLEN 256 


4 define oops(msg) | perror(msg) ; exit(1) ; ) 


int main(int ac, char x av[ D 


{ 
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/* our remote ls server port x/ 





struct  sockaddr in  saddr; /* build our address here x/ 


struct  hostent * hp; /x this is part of our x/ 
char hostname| HOSTLEN | ; /* address x/ 

int Sock id,sock fd; /* line id, file desc «/ 
FILE * sock fpi, * sock fpo; | /x streams for in and out x/ 
FILE * pipe fp; /x use popen to run ls x/ 
char dirname| BUFSIZ | ; /* from client x/ 

char command( BUFSIZ |; /* for popen() */ 

int dirlen, c; 


/** Step 1; ask kernel for a socket x x/ 


Sock id = socket( PF INET, SOCK STREAM, 0 ); /* get a socket x/ 
if ( sock id == -1) 


oops( "socket" ); 
/* * Step 2; bind address to socket. Address is host,port x x/ 


bzero( (void * )&saddr, sizeof(saddr) ); /* clear out struct */ 
gethostname( hostname, HOSTLEN ); /* where am I ? x/ 

hp = gethostbyname( hostname ); /* get info about host x/ 
bcopy( (void * )hp- >h_addr, (void * )&saddr.sin addr, hp- >h length); 
saddr.sin port - htons(PORTNUM); /x fill in socket port x/ 
saddr. sin family = AF INET ; /* fill in addr family «/ 
if ( bind(sock_id, (struct sockaddr x )&saddr, sizeof(saddr)) != 0) 


oops( "bind" ); 
/* * Step 3; allow incoming calls with Qsize=1 on socket x x/ 


if ( listen(sock id, 1) != 0) 


oops( "listen" ); 


/* 
* main loop; accept(), write(), close() 


*/ 


while ( 1 ){ 
Sock fd = accept(sock id, NULL, NULL); /x wait for call x/ 
if ( sock fd == -1) 
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oops( "accept"); 
/* open reading direction as buffered stream x/ 
if( (sock fpi = fdopen(sock fd,"r")) == NULL ) 


oops( "fdopen reading"); 


if ( fgets(dirname, BUFSIZ- 5, sock fpi) == NULL ) 
oops( "reading dirname"); 


sanitize(dirname); 


/* open writing direction as buffered stream */ 
if ( (sock fpo = fdopen(sock fd,"w")) == NULL ) 


oops( "fdopen writing"); 


sprintf(command,"ls $ s", dirname); 
if ( (pipe fp = popen(command, "r")) == NULL ) 


oops( "popen") ; 


/* transfer data from ls to socket x/ 
while( (c = getc(pipe fp)) {= EOF ) 
putc(c, sock fpo); 
pclose(pipe fp); 
fclose(sock fpo); 
fclose(sock fpi); 


} 
sanitize(char * str) 
/* 


* it would be very bad if someone passed us an dirname like 


* "; rm * "and we naively created a command "ls ; rm x 
x* 
* so..we remove everything but slashes and alphanumerics 


* There are nicer solutions, see exercises 


*/ 


char * src, * dest; 


-srctt ) 


f 


for ( src = dest = str; x src 
if ( * src == '/' |] isalnum( * src) ) 
*desttt = * src; 


x dest = "NO', 


注意 服务 器 程序 使 用 标准 缓存 流 来 读 写 数据 。 服 务 器 用 fgets 调用 从 客户 端 读 取 目录 
名 。 在 调用 popen 后 ,服务 器 就 像 复 制 文件 一 样 地 使 用 getc 和 pute 来 传输 数据 。 当 然 , 服 务 
名 实际 上 是 从 本 机 上 的 进程 向 男 一 台 机 器 上 的 进程 复制 数据 。 
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注意 sanitize 函数 的 使 用 。 对 于 任何 运行 参数 中 所 含 的 命令 或 从 因特网 上 获取 数据 的 
服务 融 ,在 编写 的 时 候 都 要 格外 小 心 。 程 序 中 的 服务 器 等 待 接收 来 目 客 户 端 的 目录 名 ,然后 
把 它 追 加 到 ls 命令 的 尾部 。 例 如 ,如 果 客 户 端 发 送 字 符 串 “/bin”, 服 务 器 将 创建 并 运行 “ls / 
bin” 命 令 。 这 是 正确 无 误 的 。 但 是 ,如 果 有 人 发 送 字符 早 “; rm x ”给 服务 器 ,服务 器 将 创建 
并 运行 “ls ; rm x ”命令 了 。 

为 了 减少 被 破坏 的 风险 ,程序 中 必须 确保 接收 的 字符 串 没有 溢出 输入 缓存 ,也 没有 溢出 
给 命令 设置 的 缓存 并 且 接 收 的 目录 名 中 不 允许 出 现 非法 字符 。popen 系统 调用 对 于 编写 网 
络 服务 来 说 是 很 危险 的 ,因为 它 直接 把 一 行 字符 串 传 给 shell。 在 网 络 程序 中 ,将 字符 串 传 给 
shell 是 一 个 非常 错误 的 想法 。 举 这 个 例子 的 目的 有 两 个 : 首先 ,展现 popen 的 另 一 种 用 法 ; 
其 次 则 是 警告 大 家 其 危险 性 。 在 使 用 的 时 候 务 必 小 心 ! 


11.6 软件 精灵 


像 很 多 Unix 程序 一 样 ,Unix 服务 器 程序 有 短小 、 简 洁 的 名 字 。 很 多 服务 器 程序 都 是 以 
d 结尾 ,如 httpd, inetd, syslogd 和 atd, X Æ HJ d 表示 精灵 (daemon) 的 意思 ,因而 如 名 叫 
syslogd 的 服务 器 程序 实际 上 是 系统 日 志 精 灵 (system log daemon)。 精 灵 就 是 一 个 为 他 人 
提供 服务 的 帮助 者 , 它 随时 等 待 去 帮助 别人 。 在 你 的 系统 中 ,输入 命令 ps -el 或 ps -ax 就 
可 以 看 到 以 字符 d 结尾 的 进程 。 然 后 ,可 以 去 阅读 这 些 命令 的 帮助 信息 ,从 而 可 以 更 加 深入 
地 理解 Unix 中 用 客户 /服务 器 模型 是 如 何 来 处 理 -一 些 基 础 操作 的 。 

大 部 分 精灵 进程 都 是 在 系统 启动 后 就 处 于 运行 状态 了 。 位 于 类 似 于 /etcyrc. d 目录 中 
的 shell 脚本 在 后 台 启 动 了 这 些 服务 ,它们 的 运行 与 终端 相 分 离 ,时 刻 准 备 提 供 数据 或 服务 。 


小 结 


1. 主要 内 容 

”一些 程 序 被 作为 单独 的 进程 建立 起 来 来 接收 和 发 送 数 据 。 在 客户 /服务 器 模型 中 , 服 

务 器 进程 为 客户 进程 提供 处 理 或 数据 服务 。 

客户 /服务 器 系统 包含 通信 系统 和 协议 。 客 户 和 服务 器 通过 管道 或 socket 进行 通信 ，。 

协议 是 会 话 过 程 中 一 系列 规则 的 集合 。 

popen 库 函 数 可 以 将 任何 shell 程序 家 入 服务 器 程序 并 且 让 对 服务 器 的 访问 就 像 访 

问 缓存 文件 一 样 。 

管道 是 一 对 相连 接 的 文件 描述 符 。socket 是 一 个 未 连接 的 通信 端点 ,也 是 一 个 潜在 

的 文件 描述 符 。 客 户 进程 通过 把 自己 的 socket 和 服务 器 端的 socket 相连 来 创建 一 

个 通信 连接。 

* sockets 之 间 的 连接 可 以 扩展 到 另 一 台 机 器 上 。 每 个 socket 以 机 器 地 址 和 端口 来 
标识 。 


O 准确 的 目录 名 依赖 于 Unix 的 版 本 。 
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。 到 管道 和 socket 的 连接 使 用 文件 描述 符 。 文 件 描述 符 为 程序 提供 了 与 文件 .设备 和 
其 他 的 进程 通信 的 统一 编程 接口 。 
2. 下 一 步 的 工作 
本 章 学 习 了 客户 /服务 器 模型 编程 的 设计 和 两 种 连接 进程 的 方法 : 管道 和 socket. TET 
一 章 中 ,将 集中 精力 学 习 客 户 /服务 器 模型 编程 的 设计 原理 ,并 编写 更 加 复杂 的 程序 。 特 别 
地 ,下 一 章 将 把 对 socket 编程 和 文件 系统 及 进程 控制 的 知识 相 结 合 来 编写 一 个 Web 服务 器 
BH. 
3. 习题 
11.1 如 采 你 经 营 的 是 一 家 比萨 饼 外 卖 店 而 不 是 时 间或 查 号 辅助 服务 的 话 , 结 果 将 如 
何 ? 协议 将 更 加 复杂 。 为 送 外 卖 服务 描述 在 服务 器 和 客户 之 间 传 送 的 消息 序 
列 。 注 意 该 协议 包含 有 一 个 循环 ,以 便 允 许 客户 增加 定购 项 。 


11.2 本 章 中 的 popen 版 本 没有 对 信和 号 做 任何 处 理 , 这 是 不 是 正确 ? 子 进程 从 父 进 程 那 
里 继承 了 信号 处 理 的 设置 。 在 考虑 以 下 三 种 情况 如 何 对 父 进 程 信号 进行 处 理 之 
后 ,回答 该 问题 : 终止 .忽略 以 及 调用 函数 。 


11.3 在 时 间 服 务 器 和 客户 端 运 行 的 例子 中 ,使 用 了 ssh 命令 从 机 器 1 登录 到 机 器 2。 
此 时 仍 登 录 在 机 器 1 上 ,但 是 在 机 器 2 上 却 运行 了 一 个 shell 进程 。 该 shell 程序 
编译 并 运行 了 时 间 服 务 客 户 端 。 

我 的 终端 确实 是 连接 到 机 妖 上 了 。 重 新 画图 11. 11 ,使 得 该 图 包含 机 器 ] 上 的 
shell 机 和 2 上 的 shell 终端 以 及 从 timeclnt 到 终端 正确 的 数据 流 。 这 可 是 一 个 
相当 复杂 的 数据 流 哦 。 


11.4 ”前面 的 章节 中 可 以 看 到 磁盘 文件 和 设备 文件 都 支持 标准 的 文件 接口 ,但 是 到 磁 
盘 文件 的 连接 与 到 设备 文件 的 连接 具有 完全 不 同 的 属性 集 。 那 么 socket 具有 什 
么 样 的 属性 呢 ? 参阅 setsockopt 的 帮助 手册 以 获取 更 详细 的 信息 。 


11.5 远 端 目录 服务 运行 了 ls 命令 。 当 ls 发 生 错 误 的 时 候 ,将 会 发 生 什么 事情 呢 ? 例 
如 ,指定 的 目录 不 存在 或 对 于 服务 器 而 言 不 可 读 , 那 么 对 ls 所 产生 的 错误 信息 如 
何 处 理 呢 ?可 以 考虑 两 种 处 理 来 自 ls 的 错误 信息 的 方法 。 首 先 , 如何 把 错误 信 
息 发 回 给 客户 端 ? 其 次 ,如 何 把 错误 信息 存放 到 日 志 中 并 通知 用 户 ? 


4. 编程 练习 
11.6 给 tinybe 程序 增加 一 c 选项 。 一 旦 增加 了 该 选项 ,下 面 的 命令 将 能 够 工作 : 


printf "2 +2\n4 « 4A\n"|tinybc ~ c|dc 
11.7 为 你 的 shell 增加 一 c 选 项 。 需 要 改变 什么 呢 ? 


11.8 编写 pclose 程序 。 该 函数 以 popen 返回 的 FILE x 作为 参数 。fdopen 函数 为 组 
MRT AE fa]. fclose Pax BIKA FEF SA EIR. OE 
4 pelose 还 必须 做 些 什 么 呢 ? 若 另 一 个 子 进程 死 在 popen 和 pclose 调用 之 间 ， 
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11. 10 


11.11 


11. 12 
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结果 又 将 会 怎样 ? 
本 章 中 的 时 间 服 务 器 并 没有 用 到 系统 调用 accept 所 提供 的 调用 者 ID 的 特性 。 


修改 timeserv. c, 使 得 它 在 接收 到 请 求 时 可 以 打印 出 如 Got a call from 123. 123. 


123. 123 (computer2. mysite, net), 


可 以 阅读 帮助 于 册 和 头 文件 来 了 解 该 工程 中 所 需要 的 函数 和 结构 体 。 


与 一 个 程序 将 sort 作为 子 程序 调用 。 程 序 须 读 取 多 行 数 据 , 存 放 到 字符 串 数 组 
中 。 接 痢 程 序 创建 两 个 管道 ,然后 创建 一 个 进程 来 运行 sort。 通 过 一 个 管道 把 
输入 序列 发 送 给 sort 的 输 人 ,再 关闭 该 管道 。 通 过 另 一 个 管道 读 取 sort 的 输 
出 ,再 把 结果 在 回 数组 中 ,并 打印 该 数组 。 


基于 System V 的 Unix 版 本 提供 了 对 双向 管道 的 支持 。 通 过 运行 下 面 的 程序 ， 
可 以 测试 某 个 版 本 的 Unix 是 否 支 持 双向 管道 ， 


/x 


* testbpd.c - test bidirectional pipes 
x/ 
main( ) 
{ 
int pL2]; 


if ( pipe(p) == -1 ) exit(1); 
if ( write(p[0], "hello", 5) == -1) 
perror( "write into pipe[0| failed"); 
else 
printf("write into pipe[0 | worked\n"); 
} 
在 内 部 ,双向 管道 含有 两 个 队列 ,一 个 从 pipeL0] 到 pipe[1], 另 一 个 则 方向 相反 。 
四 管道 的 一 问 写 数据 操作 会 把 数据 放 人 到 通 向 另 一 端的 队列 中 ,而 从 管道 的 一 
端 读 数据 则 将 数据 从 那 端 取 出 并 送 人 本 端的 队列 中 。 
如 采 你 的 系统 不 支持 双向 管道 ,可 以 生成 如 下 调用 : 
# include <(sys/types. h> 
# include < sys/socket. h> 
int apipe[2]; /x a pipe x/ 
Socketpair(AF UNIX, SOCK STREAM, PF UNSPEC, apipe); 


重新 编制 程序 tiny be. c, 使 它 使 用 一 个 双向 管道 而 不 是 使 用 两 个 单 向 的 管道 。 


更 改 timeserv. c 程序 ,使 得 它 只 响应 来 自 特 定 IP 地 址 主机 的 客户 端 。 服 务 器 接 
收 呼 岂 并 检查 客户 端 地 址 。 如 果 客 户 端 地 址 不 是 特定 的 下 , 则 服务 器 挂 断 , 否 
则 ,服务 器 将 时 间 返 回 。 

增强 该 阻塞 特征 使 服务 器 可 以 从 文件 中 读 取 所 能 接收 的 IP 地 址 列表 。 描 述 该 
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技术 的 一 些 实际 应 用 。 


大 家 知道 在 服务 器 端 使 用 popen 调用 是 非常 危险 的 。 有 两 种 方法 来 解决 该 问 
题 。 第 一 种 方法 是 编写 一 个 更 加 灵活 ,但 非常 安全 的 sanitize 函数 。 例 如 ,目录 
名 中 允许 含有 逗号 、 破 折 号 、 空 格 和 其 他 字符 。 并 且 目 录 名 中 还 可 以 含有 星 号 
和 分 号 ,这 个 处 理 可 以 像 shell 一 样 ,给 这 些 字符 赋予 特定 的 含义 。 写 一 个 更 加 


_ 有 用 的 ,但 是 安全 的 字符 串 解 析 函 数 。 


另外 一 种 方法 是 放弃 使 用 popen, 用 fork exec 和 dup 等 函数 。 用 这 种 方法 来 重 
E rlsd. cc 程序。 其 中 需要 用 到 wait R3? 为 什么 ? 


编写 一 个 位 于 端口 79 的 目录 辅助 服务 器 (finger 服务 器 )。 服 务 器 接收 单行 的 
用 户 名 输入 ,然后 给 客户 端 发 送 一 个 列表 ,其 中 包含 与 输入 匹配 的 所 有 用 户 。 


代理 (proxy) 指 的 是 接收 请 求 , 把 该 请 求 转发 给 其 他 的 服务 器 ,然后 再 将 从 服务 
锋 中 传 回 的 结果 返回 给 程序 。 这 就 类 似 于 干洗 店 的 前 台 : 它 不 做 清洁 工作 ,只 
是 把 衣服 传送 到 洗衣 设备 或 从 洗衣 设备 取 衣 服 。 

编写 一 个 时 间 服 务 右 代理 。 你 的 程序 应 当 可 以 接收 标准 端口 上 的 连接 。 为 了 
处 理 该 连接 ,程序 需要 和 真 的 时 间 服 务 建立 连接 ,从 该 服务 器 取得 时 间 ,然后 把 
时 间 转 发 给 客户 端 。 


考虑 上 一 题 中 的 关于 代理 服务 器 的 概念 。 时 间 只 是 每 秒 钟 改 变 一 次 ,如 果 你 的 
代理 服务 器 在 几 毫 秒 中 接收 了 很 多 请 求 , 就 根本 不 可 能 在 这 人 么 短 的 时 间 内 向 时 
间 服 务 器 发 送 许多 请 求 。 编 写 一 个 时 间 代 理 服务 器 ,可 以 缓存 从 时 间 服 务 器 读 
取 的 时 间 , 只 有 在 新 的 呼叫 超过 了 1 秒 的 间隔 之 后 才 去 向 时 间 服 务 器 发 送 请 求 


(参见 gettimeofday)。 


必须 承认 ,在 上 一 题 中 使 用 带 缓存 的 时 间 服 务 是 一 个 轧 窗 的 想法 。 但 在 finger 
服务 名 中 采用 缓存 技术 则 是 有 意义 ,解释 原因 。 编 写 一 个 目录 辅助 服务 器 ,使 
其 可 以 缓存 用 户 信息 。 

缓 仔 时 间 服 务 器 中 所 缓存 的 每 个 元 素 都 有 自然 的 生命 周期 (1 秒 钟 ) ,但 是 在 组 
存 的 目录 辅助 服务 器 中 如 何 决定 用 户 信息 的 保存 时 间 呢 ? 


有 些 面包 店 有 一 台 给 客户 分 发 编号 的 机 器 。 柜 台 上 写 着 “正在 服务 ”的 牌子 上 
显示 了 下 一 个 顾客 的 编号 。 设 计 一 个 客户 /服务 器 程序 来 实现 面包 数字 服务 器 
系统 。 服 务 器 产生 连续 编号 。 用 户 运 行 客 户 端 程序 来 获取 服务 器 端的 数字 。 


每 个 C 程序 员 都 知道 argv[0] 通 常 表示 正在 运行 的 程序 名 称 。 有 一 种 比较 接近 
的 方法 可 以 使 一 个 进程 获得 自己 的 名 字 。 程 序 可 以 使 用 popen, 然后 从 ps 命令 
的 输出 中 来 搜索 自己 的 进程 ID。 编 写 一 个 使 用 该 方法 的 程序 ， 
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12.1 服务 器 设计 重点 


使 用 万 维 网 是 容易 的 ,只 要 在 浏览 器 中 输入 一 个 网 址 或 者 单 击 一 个 超 链 , 服 务 器 就 会 把 
相应 的 网 页 发 送 过 来 。 但 是 Web 是 怎样 工作 的 ? 从 Web 服务 器 上 获取 网 页 和 从 时 间 服 务 
器 获取 时 间 是 类 似 的 吗 ? 

基于 socket 的 客户 /服务 器 系统 大 多 是 类 似 的 。 虽 然 电子 邮件 、 文 件 传输 .远程 登录 和 
分 布 式 数据 库 ,以 及 其 他 的 Internet 服务 在 屏幕 上 显示 的 内 容 相 异 ,但 是 它们 的 运作 原理 是 
一 致 的 。 

一 旦 理解 了 一 个 socket 流 的 客户 /服务 器 系统 ,就 可 以 理解 大 多 数 其 他 的 系统 。 在 本 章 
中 ,将 学 习 网 络 编程 的 基本 操作 和 设计 原则 ,然后 使 用 它们 来 建立 一 个 Web 服务 器 。 


12.2 二 个 主要 操作 


在 第 11 章 看 到 的 基于 socket 流 的 客户 /服务 器 系统 与 图 12. 1 看 上 去 类 似 。 客 户 和 服 
务 器 都 是 进程 。 服 务 器 设立 服务 ,然后 进入 循环 接收 和 处 理 请 求 。 客 户 连 接 到 服务 器 ,然后 
发 送 、 接 受 或 者 交换 数据 ,最 后 退出 。 该 交互 过 程 中 主要 包含 了 以 下 3 个 操作 : 

C1) 服务 器 设立 服务 。 

(2) 客户 连接 到 服务 器 。 

(3) 服务 器 和 客户 处 理事 务 。 
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客户 服务 器 : 
设立 服务 

连接 到 服务 器 。 ---------------- > ”接收 请 求 

获取 服务 ems | 

挂 断 连接 挂 断 连 接 


图 12.1 客户 /服务 器 交互 中 的 主要 步骤 


下 面 将 分 别 讨 论 每 个 操作 。 


12.3 操作 1 和 操作 2: 建立 连接 


基于 流 的 系统 需要 建立 连接 。 这 里 将 回顾 一 下 建立 连接 的 步骤 ,然后 将 这 些 步骤 抽象 
成 一 些 库 函数 。 


12.3.1 操作 1: 建立 服务 器 端 socket 


首先 ,如 图 12. 2 所 示 ,描述 了 服务 器 设立 一 个 服务 的 过 程 。 设 立 一 个 服务 一 般 需 要 如 下 
3 个 步骤 : 
(1) 创建 一 个 socket 
socket = socket(PF INET, SOCK_STREAM, 0) 
(2) 给 socket 绑 定 一 个 地 址 
bind(sock, &addr, sizeof(addr)) 
(3) 监听 接 人 请 求 


listen(sock, queue size) 


步骤 1: 
创建 一 个 服务 器 端 socket 





图 12.2 创建 服务 器 端 socket 
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为 了 避免 在 编写 服务 器 时 重复 输入 上 述 代 码 , 将 这 3 个 步骤 组 合成 一 个 函数 : make_ 
server_socket。 该 函数 的 代码 位 于 本 章 后 面 将 给 出 的 socklib. c 文件 中 。 在 编写 服务 器 的 时 
候 , 只 要 调用 该 函数 就 可 以 创建 一 个 服务 器 端 socket。 具 体 如 下 ， 


sock = nake server socket(int portnum) 


return — 1 if error, 


or a server socket listening at port "portnum" 


12.3.2 操作 2: 建立 到 服务 器 的 连接 


其 次 ,将 客户 连接 到 服务 器 。 如 图 12. 3 所 示 , 基 于 流 的 网 络 窜 户 连接 到 服务 器 包含 以 下 
两 个 步骤 : 
(1) 创建 一 个 socket 
Socket = socket(PF INET, SOCK STREAM, 0) 
(2) 使 用 该 socket 连接 到 服务 器 


connect(sock, &serv addr, sizeof(serv addr)) 
将 这 两 个 步骤 抽象 成 一 个 函数 : connect to. server, 当 编 写 客 户 端 程序 时 ,只 要 调用 该 函数 就 可 以 建立 
到 服务 器 的 连接 。 具 体 如 下 


fd = connect to server(hostname, portnum) 


return - l if error, 


or a fd open for reading and writing connected to the socket at port "portnum" on host "hostname" 


步骤 2: 创建 并 
连接 客户 Socket 
到 服务 器 





图 12.3 连接 到 服务 器 


12.3.3  socklib. c 


/* socklib.c 

党 

* This file contains functions used lots when writing internet 
* client/server programs. The two main functions here are, 

x 

* int make server socket( portnum ) returns a server socket 

E or —1 if error 

* int make server socket q( portnum, backlog) 


* 


* int connect to server(char x hostname, int portnum) 
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x returns a connected socket 
* or — 1 if error 
x*/ 

# include <stdio.h> 

# include <«<unistd. h> 

# include <sys/types.h> 

# include <«<sys/socket. h> 

# include <netinet/in. h>. 

# include <netdb. h> 

# include < time. h> 

# include <strings. h> 

# define HOSTLEN 256 

# define BACKLOG 1 


int make server socket q(int , int ); 


int make server socket(int portnum) 


{ 


return make server socket q(portnum, BACKLOG) ; 


} 


int make server socket q(int portnum, int backlog) 


1 
struct sockaddr in saddr; 
struct hostent * hp; 
char hostname[ HOSTLEN | ; 


int Sock id; 


SOCk id = socket(PF INET, SOCK STREAM, 0); 
if (sock id == -1) 


return - 1; 
/x * build address and bind it to socket x x/ 


bzero((void x )&saddr, sizeof(saddr)); 
gethostname(hostname, HOSTLEN) ; 
hp = gethostbyname(hostname) ; 


/* build our address here x/ 
/* this is part of our «/ 

/* address x/ 

/x the socket x/ 


/* get a socket x/ 


/* clear out struct x/ 
/* where am I ? x/ 

/* get info about host x/ 
/* fill in host part x/ 


bcopy( (void * )hp- >h_addr, (void * )&saddr.sin addr, 


hp ~ 7h length); 

saddr.sin port - htons(portnum); 

saddr.sin family - AF INET ; 

if ( bind(sock id, (struct sockaddr x )&saddr, 
sizeof(saddr)) 1= 0) 


return — 1; 


/* * arrange for incoming calls x x/ 


/x fill in socket port x/ 
/* fill in addr family */ 
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if ( listen(sock id, backlog) != 0) 
return — 1; 
return sock id; 


} 


int connect_to_server(char * host, int portnum) 


{ 


int sock; 
struct sockaddr_in servadd; /* the number to call x/ 
struct hostent * hp; /* used to get number x/ 


/x * Step 1; Get a socket x x/ 


sock = socket( AF INET, SOCK STREAM, 0 ); /x get a line «/ 
if (sock == -1) 


return - 1; 


/* * Step 2; connect to server x x/ 


bzero( &servadd, sizeof(servadd) ); /* zero the address x/ 
hp = gethostbyname( host ); /* lookup host’s ip # x/ 
if (hp == NULL) 


return ~ 1; 
bcopy(hp - —h addr, (struct sockaddr * )&servadd. sin addr, 

hp- —h length); 
servadd.sin port - htons(portnum); /x fill in port number x/ 
servadd.sin family - AF INET ; /* fill in socket type x/ 


if ( connect(sock, (struct sockaddr * )&servadd, 
sizeof(servadd)) !- 0) 
return ~ 1; 


return sock; 


12.4 操作 3: 客户 /服务 器 的 会 话 


至 此 ,可 以 使 用 专门 的 函数 来 建立 服务 器 端的 socket, 同 时 也 有 专门 的 函数 来 连接 到 服务 器 。 
在 实践 中 ,如 何 利用 上 述 函 数 呢 ? 客户 和 服务 器 之 间 的 交互 内 容 又 是 什么 呢 ? 在 本 节 中 ,将 学 习 
客户 端 程序 和 服务 器 端 程序 编写 的 一 般 形式 ,以 及 一 些 建 立 服务 器 的 设计 方案 ， 

1, 一 般 的 客户 端 

网 络 客户 通常 调用 服务 器 来 获得 服务 ,一 个 典型 的 客户 程序 如 下 ， 


main() 


{ 
int fd; 


fd = connect to server(host,port); /x call the server x/ 
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if(fd == -1) 

exit(1); /x or die x/ 
talk with server(fd); /* chat with server */ 
close(fd); /* hang up when done x/ 


j 


函数 talk with server 处 理 与 服务 器 的 会 话 。 具 体 的 内 容 取决 于 特定 应 用 。 例 如 ， 
e-mail 客 户 和 邮件 服务 器 交谈 的 是 邮件 ,而 天 气 预报 客户 和 服务 器 交谈 的 则 是 天 气 。 
2. 一 般 的 服务 器 端 


main() 
( 
int sock, fd; /* socket and connection x/ 
sock = make server socket(port); 
if(sock == -1) 
exit(1); 
while(1) 
{ 
fd = accept(sock, NULL, NULL) ; /* take next call x/ 
if(fd == -1) 
break; /* or die x/ 
process request(fd); /* chat with client x/ 
close(fd); /* hang up when done x/ 


j 
j 


K% process request 处 理 客户 的 请 求 。 具 体 的 内 容 取决 于 特定 应 用 。 例 如 ,邮件 服务 
锋 告 诉 客户 信件 信息 ,天 气 服务 器 则 告诉 客户 天 气 情况 。 


12.4.1 使 用 socklib. c 的 timeserv/timeclnt 


如 何 利 用 上 面 的 模板 来 建立 客户 /服务 器 系统 呢 ? 例 如 ,在 该 框架 下 本 文 的 时 间 系 统 客 
户 / 服 务 器 是 怎样 的 呢 ? 图 12. 4 对 此 做 了 解释 。 为 了 使 用 socklib. c 重 写 时 间 客 户 和 服务 
髓 , 这 里 编写 了 处 理会 话 的 函数 talk with server 用 于 客户 端 ,而 process_request 用 于 服务 





图 12.4 时 间 服 务 器 和 客户 端 版 本 1 
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Qi Pii o 

talk with server(fd) process request(fd) 

( { 
char buf[ LEN]; time t now; 
int n; char * cp; 

time (&now); 

n= read(fd, buf , LEN) ; cp = ctime(&now) ; 
write(1,buf,n); write(fd,cp,strlen(cp)) ; 


j j 


服务 器 调用 time 从 内 核 中 获得 时 间 , 然 后 用 ctime 将 时 间 转 换 成 可 以 打印 的 字符 串 。 
服务 器 将 该 字符 串 写 到 socket 中 ,发 送 给 客户 端的 socket。 客 户 从 socket 中 读 取 该 字符 串 ， 
然后 写 到 标准 输出 中 。 这 个 新 的 版 本 六 循 了 先前 版 本 的 程序 逻辑 ， 但 是 设计 更 加 模块 化 , 代 
码 更 加 清晰 。 


12.4.2 第 2 版 的 服务 器 : 使 用 fork 


现在 考虑 第 二 版 服务 器 的 设计 。 第 二 版 中 程序 没有 通过 调用 time 函数 来 获得 代表 时 间 
的 数据 ,而 是 直接 使 用 了 一 个 shell 命令 (date 命令 ) ,如 图 12. 5 所 示 





图 12.5 服务 器 使 用 fork 运行 date 


代码 如 下 : 


process request(fd) 
/* 
* send the date out to the client via fd 
x/ 
{ 
int pid = fork(); 


switch( pid) 
{ 
case — 1;return; /* can not provide service x / 
case 0;dup2(fd,1); /* child runs date x/ 
close(fd); /* by redirecting stdout x/ 


execl("/bin/date", "date", NULL) ; 
oops( "execlp"); , /* or quits x/ 
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default; wait (NULL); /* parent wait for child x/ 


j 


如 图 12.5 所 示 , 服 务 器 用 fork 建立 一 个 新 的 子 进程 。 该 子 进程 将 标准 输出 重 定向 到 
socket ,然后 运行 date。date 命令 给 出 日 期 ,然后 将 日 期 写 到 标准 输出 ,这 样 就 把 字符 串 发 送 
到 客户 端 了 。 在 程序 中 调用 了 wait. shell 通常 在 调用 fork 后 要 调用 wait, 那 么 这 里 的 调用 
有 意义 吗 ? 本 文 将 在 下 一 节 中 探讨 该 问题 。 


12.4.3 服务 器 的 设计 问题 : DIY 或 代理 


这 里 使 用 了 两 种 服务 器 的 设计 方法 : 

。 自己 做 (Do It Yourself,DIY) 一 一 服务 器 接收 请 求 , 自己 处 理工 作 。 

。 代理 一 一 服务 器 接收 请 求 ,然后 创建 一 个 新 进程 来 处 理工 作 。 

每 种 方法 的 优 缺 点 各 是 什么 ? 

。 自己 做 用 于 快速 简单 的 任务 

计算 当前 的 日 期 和 时 间 需 要 系统 调用 time AJE PRX ctime。 使 用 fork 和 exec 来 运行 
date 至 少 需 要 3 个 系统 调用 和 创建 一 个 新 的 进程 。 对 于 一 些 服务 器 ,效率 最 高 的 方法 是 服务 
货 目 己 来 完成 工作 并 且 在 listen 中 限制 连接 队列 的 大 小 。 文 件 socklib. c 中 的 make server. 
socket q 函数 以 队列 大 小 作为 参数 。 

。 代理 用 于 慢 速 的 更 加 复杂 的 任务 

服务 器 处 理 耗 时 的 任务 或 等 待 资源 时 ,需要 代理 来 完成 其 工作 。 这 就 像 商 务 中 的 电话 
接线 员 ,接收 电话 ,把 连接 传递 到 下 一 个 销售 或 服务 人 员 ,然后 再 回 过 去 接收 下 一 个 电话 ,而 
服务 絮 可 以 使 用 fork 创建 一 个 新 进程 来 处 理 每 个 请 求 。 通 过 这 种 方式 ,服务 器 可 以 同时 处 
理 多 个 任务 。 

。 使 用 SIGCHLD 3EFH IE f& FF (zombie) 问题 

除了 等 待 子 进程 死亡 外 , 父 进程 可 以 设置 为 接收 表示 子 进程 死亡 的 信号 。 第 8 章 中 解释 
了 当 子 进程 退出 或 被 终止 时 ,内 核发 送 SIGCHLD 给 父 进程 。 但 它 不 同 于 本 文 讨论 的 其 他 信 
号 ,默认 时 SIGCHLD 是 被 忽略 的 。 父 进程 可 以 为 SIGCHLD 设置 一 个 信和 号 处 理 函 数 , 它 可 
以 调用 wait。 具 体 方 法 如 下 : 


/* naive use of SIGCHLD handler with wait() — buggy «/ 
main() 
{ 
int sock, fd; 
void child waiter(int),process request(int); 
signal(SIGCHLD,child waiter); 
if( (sock = make server socket(PORTNUM)) = = -1) 
oops("make server socket"); 
j 
while(1) | 
fd = accept(sock , NULL, NULL) ; 
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if(fd== - 1) 
break ; 
process request( fd); 
close(fd) ; 
' 
} 
void child waiter(int signum) 
{ 
wait(NULL) ; 
} 
void process request(int fd) 


| 


if(fork() ==0) | /x child x/.- 
dup2(fd,1); /* moves socket to fd 1 */ 
close( fd); /* closes socket x/ 


execlp("data","date",NULL); /x exec date x/ 
oops( "execlp date"); 
} 
} 


下 面 来 分 析 程 序 中 的 流程 控制 。 当 一 个 请 求 过 来 时 , 父 进程 使 用 fork, 9A Je C ok Br BD 
返回 去 接收 下 一 个 请 求 , 让 子 进程 去 处 理 请 求 。 当 子 进程 退出 时 , 父 进 程 收 到 SIGCHLD 信 
号 , 跳 到 处 理 滑 数 并 调用 wait。 子 进程 从 进程 表 中 被 删除 , 父 进程 从 处 理 图 数 返 回 到 主 函 
数 。 该 过 程 看 上 去 似乎 很 完美 了 ,不 过 其 中 存在 着 两 个 问题 。 

问题 1 是 程序 运行 到 信号 处 理 函 数 跳 转 时 会 中 断 系 统 调用 accept。 当 accept 被 信号 
中 断 时 ,返回 一 1, 然 后 设置 errno 到 EINTR。 代 码 中 把 accept 返回 的 一 1 作为 错误 ,然后 从 
主 循环 中 跳出 来 。 这 里 需要 更 改 main 函数 来 区 分 真正 的 错误 和 被 打 断 的 系统 调用 所 产生 
的 错误 。 这 个 作为 练习 ,由 读者 完成 。 

问题 2 关于 Unix 是 如 何 处 理 多 个 信号 的 。 如 果 多 个 子 进程 几乎 同时 退出 ,将 会 发 生 
什么 ?假设 同时 有 3 个 SIGCHLD 发 送 到 父 进程 。 最 先 到 达 的 信号 导致 父 进程 跳 到 处 理 函 
数 , 然 后 父 进程 调用 wait 来 保证 子 进程 已 经 从 进程 表 中 删除 。 这 样 就 可 以 了 吗 ”? 

当 父 进程 在 运行 信号 处 理 函 数 时 ,其 他 两 个 信和 号 的 到 达 导 致 Unix 阻塞 ,但 是 并 不 缓存 
信号 。 从 而 ,第 二 个 信号 被 阻塞 ,而 第 三 个 信号 丢失 了 。 此 时 ,如 果 还 有 其 他 的 子 进 程 退 出 ， 
来 自 于 这 些 子 进程 的 信号 也 将 丢失 。 信 和 号 处 理 函 数 只 调用 了 wait 一 次 ,所 以 每 次 丢失 一 个 


”信号 意味 着 少 调用 了 一 次 wait, ORES WEP HE (zombie), FRR TEA EAD KA 


中 调用 wait 足够 多 的 次 数 来 去 除 所 有 的 终止 进程 。waitpid 函数 解决 了 此 问题 ， 


void child waiter(int signum) 

] 

while(waitpid( - 1,NULL,WNOHANG) — 0); 
} 
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waitpid 提供 了 wait 函数 超 集 的 功能 。 其 第 一 个 参数 表示 它 所 要 等 待 的 进程 ID 号 。 值 
一 1 表示 等 待 所 有 的 子 进程 。 第 二 个 参数 是 指向 整 型 值 的 指针 ,用 来 获取 状态 。 服 务 右 并 不 
关心 子 进程 中 发 生 了 什么 ,不 过 一 个 健壮 的 服务 器 可 能 用 该 信息 来 跟 踊 错误 。 

waitpid 的 最 后 一 个 参数 表示 选项 。WNOHANG 参数 告诉 waitpid: 如 果 没 有 僵尸 进 
FE Wl AN SF 

该 循环 直到 所 有 退出 的 子 进程 都 被 等 待 了 才 停 止 。 即 使 多 个 子 进程 同时 退出 并 产生 了 
多 个 SIGCHLD, 所 有 的 这 些 信号 都 会 被 处 理 。 


12.5 编写 Web 服务 器 


至 此 ,已 经 学 习 了 编写 Web 服务 器 的 必 备 知识 。Web 服务 器 是 已 经 编写 的 目录 服务 器 
的 扩展 。 主 要 的 扩展 是 一 个 cat 服务 器 和 一 个 exec 服务 器 。 


12.5.1 Web 服务 器 功能 


Web 服务 器 通常 要 具备 3 种 用 户 操 作 : 
(D 列举 目录 信息 。 

(2) cat 文件 。 

(3) 运行 程序 。 





图 12.6 Web 服务 器 提供 远程 ls cat exec 


Web 服务 器 通过 基于 流 的 socket 连接 为 客户 提供 上 述 3 种 操作 。 如 图 12. 6 Pra. HA 
连接 到 服务 器 后 ,发 送 请 求 ,然后 服务 器 返回 客户 请 求 的 信息 。 具 体 过 程 如 下 : 


客户 端 : 服务 器 端 

用 户 选择 一 个 链接 

连接 服务 器 一 接收 请 求 

GR > RGR 
处 理 请 求 ， 


目录 :显示 目录 列表 

文件 :显示 内 容 

. cgi 文件 ;运行 

不 存在 : 错误 消息 
该 取 应 答 aii Tj WA 
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HE Wt 

显示 应 答 
html :解析 
image: 绘 图 


sound :运行 


重复 ~ 
12.5.2 设计 Web 服务 器 


所 要 编写 的 操作 如 下 。 

(1) 建立 服务 器 

可 以 使 用 socklib. c 中 的 make server socket, 

(2) 接收 请 求 

使 用 accept 来 得 到 指向 客户 端的 文件 描述 符 。 可 以 使 用 fdopen 使 得 该 文件 描述 符 转 换 
成 缓冲 流 。 

(3) 读 取 请 求 

什么 是 一 个 请 求 ? 客户 端 如 何 请 求 服务 ? 这 些 需 要 进一步 学 习 。 

(4) 处 理 请 求 

已 经 知道 了 如 何 列 出 目录 信息 、cat 文件 以 及 运行 程序 。 通 过 opendir 和 readdir、open 
和 read、dup2 和 exec 的 使 用 可 以 实现 上 述 功 能 。 

C) ERU 

什么 是 一 个 应 答 ? 客户 端 期 待 接收 的 又 是 什么 ?” 这些 也 需要 进一步 地 学 习 。 至 此 ,已 

学 习 了 几乎 所 有 的 编写 Web Hk 5 ae A) AiR AAR BE. 所 剩 的 是 Web 服务 器 协议 的 学 习 。 


12.5.3 Web 服务 器 协议 


客户 端 (浏览 器 ) 与 Web 服务 器 之 间 的 交互 主要 包含 客户 的 请 求 和 服务 器 的 应 答 。 请 求 
和 应 答 的 格式 在 超 文 本 传输 协议 (HTTP) 中 有 定义 。HTTP 像 上 一 章 中 的 时 间 服 务 器 和 
finger 服务 器 的 协议 一 样 ,使 用 纯 文 本 。 就 像 在 时 间 服 务 器 和 finger 服务 器 中 所 做 的 ， 这 里 
可 以 使 用 telnet 和 Web 服务 器 进行 交互 。Web 服务 器 在 端口 80 监听 。 下 面 是 一 个 实际 的 
例子 : 


$ telnet www. prenhall. com 80 
Trying 165.193.123.253... 
Connected to www. prenhall. com. 
Escape character is '^]'. 


GET /index.html HTTP/1.0 


HTTP/1.1 200 OK 

server ; Netscape - Enterprise/ 3.6 SP3 
Date;Tue,22 Jan 2002 16:11:14 GMT 
Content - type: text/html 
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Last - modified;Fri, 08 Sep 2000 20:20:06 GMT 
Content — length:327 
Accept — ranges; bytes 


Connection:close 


«HTML <c HEAD > 

<META HTTP-EQUIV = "Refresh"CONTENT = "0; 
URL = http; //vig. prenhall. com/ "> 
</HEAD> <BODY> </BODY> </HTML> 


SC tt ~- re ta > 

<l 一 一 Caught you peeking! 一 一 > 
<P -~ > 
Connection closed by foreign host. 

$ 


这 里 只 发 送 了 一 行 请 求 , 却 接 收 了 多 行 返回 。 知 道具 体 细 节 吗 ? 

1. HTTP Æ.: GET 

telnet 创建 了 一 个 socket 并 调用 了 connect 来 连接 到 Web 服务 器 。 服 务 器 接受 连接 请 
求 , 并 创建 了 一 个 基于 socket 的 从 客户 端的 键盘 到 Web 服务 进程 的 数据 通道 

接 下 来 ,输入 请 求 : 


GET /index. html HTTP/1.0 


一 个 HTTP 请 求 包含 有 3 个 字符 串 。 第 一 个 字符 串 是 命令 ,第 二 个 是 参数 ,第 三 个 是 所 
用 协议 的 版 本 号 。 在 该 例子 中 ,使 用 了 GET 命令 ,以 index. html 作为 参数 ,使 用 了 HTTP 
版 本 1. 0。 

HTTP 还 包含 几 个 其 他 的 命令 。 大 部 分 Web 请 求 使 用 GET, 因 为 大 部 分 时 间 中 用 户 是 
单 击 链接 来 获取 网 页 。GET 命令 可 以 跟 几 行 参数 。 这 里 使 用 了 简单 的 请 求 ,以 一 个 空 行 来 
表示 参数 的 结束 ,并 使 用 与 本 书 前 面 提 及 的 关于 shell 的 相同 约定 。 实 际 上 ,一 个 Web 服务 
器 只 是 集成 了 cat M ls 的 Unix shell, 

2. HTTP 应 答 ， OK 

AR ae EDK ,检查 请 求 , 然 后 返回 一 个 请 求 。 应 答 有 两 部 分 : 头 部 和 内 容 。 头 部 以 
状态 行 起 始 ,如 下 所 示 : 


HTTP/1.1 200 OK 


状态 行 含 有 两 个 或 更 多 的 字符 串 。 第 一 个 串 是 协议 的 版 本 ,第 二 个 串 是 返回 码 ,这 里 
是 200 ,其 文本 的 解释 是 OK。 这 里 请 求 的 文件 叫 /info. html, 而 服务 器 给 出 应 答 表 示 可 以 
得 到 该 文件 。 如 果 服 务 器 中 没有 所 请 求 的 文件 名 ,返回 码 将 是 404, 其 解释 将 是 “未 找到 ”。 

头 部 的 其 余部 分 是 关于 应 答 的 附加 信息 。 在 该 例子 中 ,附加 信息 包含 服务 器 名 、 应 答 时 
Ia] 服务器 所 发 送 数据 类 型 以 及 应 答 的 连接 类 型 。 一 个 应 答 头 部 可 以 包含 有 多 行 信 息 ,以 空 
行 表示 结束 , 空 行 位 于 Connection: close 后 H 。 

应 答 的 其 余部 分 是 返回 的 具体 内 容 。 这 里 ,服务 器 返回 了 文件 /index. html MAA, 
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3. HTTP 小 结 

7 PW web 服务 器 交互 的 基本 结构 如 下 : 

(1) 客户 发 送 请 求 

GET filename HTTP/version 

可 选 参数 

空 行 

(2) AR 88 AIK wl 

HTTP/version status-code status-message 

附加 信息 

空 行 

内 容 | 

协议 的 完整 描述 可 以 参阅 网 上 的 版 本 1.0 的 RFC1945 和 版 本 1.1 的 RFC2068, 

Web 服务 器 必须 接收 客户 的 HTTP 请 求 ,并 发 送 HTTP 应 答 。 请 求 和 应 答 采 用 纯 文本 
格式 ,是 为 了 便于 使 用 C 中 的 输入 /输出 以 及 字符 串 函 数 读 取 和 处 理 。 


12.5.4 编写 Web 服务 器 


要 求 Web 服务 器 只 支持 GET 命令 ,只 接收 请 求 行 , 跳 过 其 余 参 数 ,然后 处 理 请 求 和 发 送 
应 管 ,主要 循环 如 下 ， 


while(1) 

{ 
fd = accept (sock, NULL, NULL) ; /* take a call x/ 
fpin- fdopen(fd,"r"); /x make it a FILEx x/ 
fgets(fpin, request,LEN); /* read client request x/ 
read until crnl(fpin); /* Skip over arguments x/ 
process rg(request,fd); /* reply to client x/ 
fclose(fpin); /* hang up connection x/ 


} 


为 了 简洁 起 见 ,这 里 忽略 了 出 错 检 查 。 
1. 处 理 请 求 
处 理 请 求 包含 识别 命令 和 根据 参数 进行 处 理 . 


process rq( char * rq, int fd ) 


{ 
char cmd[11], arg[513]; 


if ( fork() != 0) /* if a child, do work x/ 


return; /* if parent,return x/ 
sscanf(rq, "%10s%512s" 


, cmd, arg); 


if ( stremp(cmd,"GET") {= Q ) /* check command x / 
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cannot_do(fd) ; 


else if ( not_exist( arg ) ) /* does the arg exist x/ 
do 404(arg, fd 5; /x n; tell the user x/ 
else if ( isadir( arg ) ) /* is it a directory? x/ 
do ls( arg, fd); /x y; list contents */ 
else if ( ends in cgi( arg ) ) /* name is X. cgi? */ 
do exec( arg, fd); /x y, execute it x/ 
else /x otherwise x/ 
do cat( arg, fd ); /x display contents «/ 


} 


服务 器 为 每 个 请 求 创建 一 个 新 的 进程 来 处 理 。 子 进程 将 请 求 分 割 成 命令 和 参数 。 如 果 
命令 不 是 GET ,服务器 应 答 HTTP 返回 码 表示 未 实现 的 命令 。 如 果 命 令 是 GET, 服 务 器 将 
期 望 得 到 目录 名 ,一 个 以 . cgi 结尾 的 可 执行 程序 或 文件 名 。 如 果 没 有 该 目录 或 指定 的 文件 
LEE ETE TE o 

如 果 存 在 目录 或 文件 ,服务 器 决定 所 要 使 用 的 操作 : ls exec 或 cat. 

2., Bk FI LA BH 

PRX do ls 处 理 列 出 目录 信息 的 请 求 : 


do ls(char * dir, int fd) 
1 


FILE * fp; 

fp = fdopen(fd,"w"); /* make socket into a FILE * x/ 
header(fp, "text/plain"); /x send HTTP reply header «/ 
fprintf(fp,"\r\n"); /* and end of header mark x/ 
fflush(fp); /x force to socket x/ 
dup2(fd,1); /x make socket stdout */ 
dup2(fd,2); /x make socket stderr x/ 
close(fd); /* close socket x/ 


execl("/bin/ls","1s","— l",dir,NULL); /x ls - 1 does the work x/ 
perror(dir); /x or it doesn’t */ 
| exit(1); /* child exits 关 / 
} 


这 里 没有 像 前 面 章节 中 的 目录 服务 一 样 使 用 popen, 而 是 通过 调用 ls 命令 ,避免 了 客户 
间 shell popen 传递 任意 字符 串 来 运行 的 问题 。 

其 他 的 函数 包含 在 本 章 的 后 面部 分 中 。 程 序 可 以 工作 ,但 它 并 不 完整 ,也 不 安全 。 需 要 
做 如 下 的 改进 : 

(OD 伪 尸 进程 的 去 除 ; 

(2) 缓存 溢出 保护 ; 
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(3) CGICCommon Gateway Interface, 通 用 网 关 接 口 ) 程 序 需要 设置 一 些 环境 变量 ; 
(4) HTTP 头 部 可 以 包含 更 多 的 信息 。 
该 程序 是 一 个 包含 230 行 C 代 码 的 完整 的 Web 服务 器 ,包含 注释 和 空 行 。 


12.5.5. 运行 Web Hk 3$ a 
编译 程序 ,在 其 个 端口 运行 它 : 


$ cc webserv.c socklib.c - o webserv 


$ ./webserv 12345 


现在 可 以 访问 Web ARS 8 ,网址 为 http://yourhostname:12345/, # html 文件 放 到 该 
Boe IF HJH http://yourhostname: 12345//filename. html 来 打开 它 。 创 建 下 面 的 shell 


BA : 


# 1 /bin/sh 
it hello.cgi-a cheery cgi page 
printf "Content-type.text/plainXnXnhelloXn"; 


将 它 命名 为 hello. cgi, 用 chmod 改变 权限 为 755, 然 后 用 浏览 器 调用 该 程序 : httpi// 
yourhostname:12345/hello. cgi. 


12.5.6 Webserv 的 源 程序 
下 面 是 简单 Web 服务 器 的 代码 : 


/x webserv.c - a minimal web server (version 0.2) 
x usage; ws portnumber 


x features; supports the GET command only 


* runs in the current directory 

x forks a new child to handle each request 

x has MAJOR security holes, for demo purposes only 
x has many other weaknesses, but is a qood start 

x build; cc webserv.c socklib.c - o webserv 

*/ 


# include «< stdio. h> 

# include <(sys/types. h> 
# include <Csys/stat. h> 
# include <(string. h> 


main(int ac, char x av[]) 
人 
int sock, fd; 
FILE * fpin; 
char | request| BUFSIZ]; 


一 
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if Cac == 1 ){ 
fprintf(stderr, "usage; ws portnum\n") ; 
exit(1); 

} 


sock = make server socket( atoi(av[1]) ); 


if ( sock == -1) exit(2); 
/* main loop here x/ 


while(1){ 
/* take a call and buffer it «/ 
fd = accept( sock, NULL, NULL ); 
fpin = fdopen(fd, "r" ); 


/* read request «/ 
fgets(request,BUFSIZ,fpin); 

printf("got a call, request = 5s", request); 
read til crnl(fpin); 


/* do what client asks x/ 
process rq(request, fd); 


fclose(fpin); 


read til crnl(FILE x) 


Skip over all request info until a CRNL is seen 


read til crnl(FILE * fp) 


( 
char buf| BUFSIZ |; 


while( fgets(buf,BUFSIZ,fp) != NULL && stremp(buf,"\r\n") != 0); 


process rq( char * rq, int fd) 

do what the request asks for and write reply to fd 
handles request in a new process 

rq is HTTP command; GET /foo/bar. html HTTP/1.0 


process rq( char * rq, int fd ) 


{ 
char cmd| BUFSIZ], arg[ BUFSIZ]; 


/* create a new process and return if not the child x/ 
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if ( fork() !- 0) 


return; 


strcpy(arg, "./"); /x precede args with ./ */ 
if ( sscanf(rq, "%s%s", cmd, arg * 2) !- 2) 


return; 


if ( stromp(cmd, "GET") !- 0) 
cannot do(fd); 
else if ( not exist( arg ) ) 
do 404(arg, fd); 
else if ( isadir( arg ) ) 
do 1s( arg, fd); 
else if ( ends in cgi( arg ) ) 
do exec( arg, fd); 
else 
do cat( arg, fd); 


the reply header thing; all functions need one 


if content type is NULL then don't send content type 





—-—2l22l222.222222222222222222222 --- x/ 
header( FILE x fp, char x content type) 
{ 

fprintf(fp, "HTTP/1.0 200 OK\r\n"); 

if ( content type ) 

fprintf(fp, "Content ~ type; *s\r\n", content type ); 

j 
/XX 一 一 一 x 

simple functions first; 

cannot do(fd) unimplemented HTTP command 
and do 404(item,fd) no such object 
一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 x/ 


cannot do(int fd) 
pO 
FILE x fp = fdopen(fd,"w"); 


fprintf(fp, "HTTP/1.0 501 Not Implemented\r\n") ; 
fprintf(fp, "Content - type; text/plain\r\n") ， 
fprintf(fp, "\r\n"); 


fprintf(fp, "That command is not yet implemented\r\n") ; 
fclose(fp); 
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do 404(char x item, int fd) 
( 
FILE x fp = fdopen(fd,"w"); 


fprintf(fp, "HTTP/1.0 404 Not Found\r\n") ; 
fprintf(fp, "Content - type; text/plain\r\n") ; 
fprintf(fp, "\r\n"); 


fprintf(fp, "The item you requested; %s\r\nis not found\r\n", item); 
fclose(fp); 


the directory listing section 
isadir() uses stat, not exist() uses stat 


do ls runs ls. It should not 





isadir(char x f) 
{ 
struct stat info; 
return ( stat(f, &info) I= - 1 && S ISDIR(info.st mode) ); 


not exist(char * f) 
| 
struct stat info; 


return( stat(f,&info) -- -1); 


F 


do is(char * dir, int fd) 
{ 
FILE x fp; 


fp = fdopen(fd,"w"); 
header(fp, "text/plain"); 
fprintf(fp, "\r\n") ; 
fflush (fp); 


dup2(fd,1); 

dup2(fd,2); 

close(fd) ; 

execip( "1s", "1s", "— 1" dir, NULL); 
perror(dir); 

exit(1); 


。 377 
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the cgi stuff. function to check extension and 


one to run the program. 


char x file type(char x f) 


/x returns 'extension' of file x/ 


( 


j 


char * Cp; 
if ( (cp = strrchr(f, '.')) t= NULL) 
return cpt+1; 


return ""; 


ends in cgi(char x f) 


1 


} 


return ( strcmp( file type(f), "cgi" ) == 0); 


F 


do exec( char * prog, int fd ) 


{ 


FILE x fp; 


fp = fdopen(fd,"w"); 
header(fp, NULL); 
fflush(fp); 

dup2(fd, 1); 

dup2(fd, 2); 
close(fd); 
execl(prog, prog, NULL); 


perror(prog); 


do cat(filename,fd) 


sends back contents after a header 


do cat(char * f, int fd) 


( 


char x extension = file type(f); 
char * content - "text/plain"; 
FILE x fpsock, x fpfile; 

int C; 

if ( stremp(extension,"html") -- 0) 


content - "text/html"; 


else if ( strcempCextension, "gif") == 0) 
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content = "image/gif": 

else if ( strcmp(extension, "jpg") == 0) 
content = "image/jpeg"; 

else if ( stremp(extension, "jpeg") == 0) 


content - "image/jpeg"; 


fpsock = fdopen(fd, "w"); 
fpfile = fopen( f , "r"); 
if ( fpsock {= NULL && fpfile !- NULL) 
{ 
header( fpsock, content) ; 
fprintf(fpsock, "\r\n"); 
while( (c = getc(fpfile) ) l= EOF ) 
putc(c, fpsock); 
fclose(fpfile); 
fclose(fpsock); 


} 
exit(0); 
} 


12.5.7 比较 Web 服务 器 


Web 服务 器 允许 其 他 机 器 上 的 客户 得 到 目录 信息 、 读 取 文 件 和 运行 程序 。 所 有 的 Web 
服务 器 都 要 完成 这 些 基 本 操作 ,并且 必 须 遵 守 HTTP 协议 。 

那么 服务 器 之 间 有 什么 区 别 呢 ? 有 的 服务 器 容易 配置 和 操作 ,有 的 提供 了 更 多 的 安全 
特征 ,有 的 则 快速 处 理 请 求 或 使 用 较 少 的 内 存 。 其 中 一 个 重要 的 特征 是 服务 器 的 效率 问题 。 
服务 兹 可 以 同时 处 理 多 少 个 请 求 ” 对 于 每 个 请 求 ,服务 器 需要 多 少 系 统 资源 ? 

本 书 的 Web 服务 器 对 于 每 个 请 求 都 创建 新 进程 来 处 理 。 这 是 最 高 效 的 方法 吗 ? 读 取 文 
件 和 目录 的 请 求 需要 较 长 的 时 间 , 所 以 服务 器 没有 必要 等 待 这 些 操作 完成 ,但 是 有 必要 用 一 
个 新 的 进程 吗 ? 

有 第 三 种 方法 可 以 同时 运行 多 个 操作 。 程 序 可 以 在 一 个 进程 中 运行 多 个 任务 ,这 可 通 
过 使 用 线程 (thread) 来 实现 。 在 后 面 的 章节 中 将 学 习 它 的 使 用 。 


小 结 
1 主要 内 容 
。 基于 socket 的 客户 /服务 器 程序 遵循 一 个 标准 框架 。 服 务 器 接收 和 处 理 请 求 , 客 户 发 


”服务 器 建 立 服务 器 端 socket。 服 务 器 端 socket 有 具体 的 地 址 ,用 来 接收 连接 。 
。 客户 创建 和 使 用 客户 端 socket。 客 户 并 不 关心 客户 端 socket 的 地 址 。 
”服务 器 可 以 用 两 种 方法 之 一 处 理 请 求 : 自己 处 理 请 求 ,或 使 用 fork 创建 新 进程 来 处 
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理 请 求 。 
* Web 服务 器 是 最 受 欢迎 的 基于 socket 的 程序 。Web 服务 器 处 理 3 种 类 型 的 请 求 : 
返回 文件 内 容 、 有 目录 列表 和 运行 程序 。 请 求 和 应 答 协 议 称 为 HTTP. 
2. 下 一 步 做 什么 
电话 呼叫 模型 不 是 客户 和 服务 器 通信 的 惟一 方式 。 有 些 人 通过 邮件 发 送 定购 请 求 来 买 
商品 。 使 用 基于 消息 的 通信 系统 ,每 个 购物 者 可 以 一 次 处 理 多 个 商店 的 购物 ,而 商店 可 以 同 
时 处 理 多 个 顾客 的 请 求 。 在 下 一 章 中 ,将 学 习 使 用 明信片 模型 的 网 络 编程 : 数据 报 
(Datagram) socket, 
3. 习题 


12.1 


12.2 


在 时 间 服 务 的 例子 中 调用 了 read 和 write 一 次 。 如 果 服 务 器 端 发 送 过 来 的 数据 
分 几 次 到 达 或 超出 缓存 的 大 小 将 会 怎样 ? 如 果 客 户 端 需要 多 次 调用 read, 该 如 
何 修改 ? 在 服务 器 端 ,write 的 返回 值 小 于 字符 串 的 长 度 , 又 会 怎样 ? 


修订 版 的 SIGCHLD 的 处 理 函 数 是 用 waitpid 和 一 个 循环 。 那 么 可 以 在 一 个 循 
环 中 使 用 常规 的 wait 来 处 理 多 个 信和 号 问题 吗 ? 


4. 编程 练习 

12.3 改写 本 章 中 的 一 般 服务 器 模型 ,使 得 它 被 信号 中 断 时 ,可 以 重 起 调用 accept, 

12.4 ME Web 服务 器 ,使 得 它 保 留 所 有 请 求 和 返回 状态 的 日 志 人 信息。 

12.5 24 Web 服务 器 接收 CGI 程序 请 求 时 ,服务 器 将 设置 一 些 CGI 程序 的 环境 变量 ， 
找 出 这 些 环境 变量 ,并 把 其 中 的 一 些 加 到 Web FRA BETH, Shell 一 章 中 解释 了 如 
何 设置 环境 变量 。 

12.6 Web 服务 器 可 以 使 用 两 种 方法 来 识别 每 个 请 求 所 要 运行 的 程序 。 本 章 中 是 以 . 


12. 7 


12.8 


12.9 


cgi 作为 扩展 名 来 识别 要 运行 的 程序 。 另 一 种 方法 是 使 用 路 径 。 特 别 地 ,如 果 请 
求 的 路 径 中 包含 有 目录 名 cgi-bin, 该 程序 就 被 运行 。 例 如 ,对 于 /cgi-bin/counter 
的 请 求 在 该 系统 下 将 被 服务 器 执行 。 改 写 服务 器 以 支持 这 种 方法 。 


改写 Web 服务 器 使 得 它 可 以 发 送 更 多 的 信息 。 书 中 例子 中 的 连接 给 出 了 典型 的 
头 部 项 的 集合 。 将 这 些 项 增加 到 Web 服务 器 中 。 


改写 Web 服务 器 以 支持 HEAD 请 求 。 阅 读 HTTP 协议 获取 详细 信息 
PEE; Web 服务 器 以 支持 POST 请 求 。 阅 读 HTTP 协议 获取 详细 信息 。 


5. 项 目 
基于 本 章 的 内 容 , 可 以 学 习 编 写 下 面 的 Unix 程序 : 


httpd,teinetd,fingerd,ftpd 
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概念 与 技巧 

， 基 于 数据 报 的 编程 ,数据 报 socket 
« TCP 与 UDP 

许可 证 服务 器 

。 软件 时 间 戳 (Software ticket) 

， 设 计 健壮 系统 

。 设计 分 布 式 系统 

* Unix 域 的 socket 

相关 的 系统 调用 与 函数 


* socket 


e sendto,recvfrom 


13.1 软件 控制 


程序 的 运行 需要 内 存 .CPU 和 一 些 系统 资源 。 操 作 系 统 关心 这 类 事情 ,但 是 一 些 程序 还 
需要 关心 为 一 件 事情 ; 就 是 程序 拥有 者 的 允许 。 

从 合法 性 的 角度 讲 ,需要 有 一 个 许可 证 (license) 来 保证 程序 的 合法 运行 ,但 是 有 些许 可 
证 却 是 带 有 限制 的 。 例 如 ,有 的 许可 证 是 限制 同时 运行 程序 的 用 户 数 。 一 个 10 人 的 许可 证 
可 能 需要 一 定 的 花费 ,而 50 人 的 许可 证 可 能 需要 更 多 的 花费 。 有 些 厂商 租赁 软件 许可 证 , 当 
租赁 期 到 了 ,程序 就 不 能 继续 运行 。 当 然 除 了 合法 性 方面 之 外 ,软件 也 还 受到 其 他 一 些 因素 
的 限制 。 学 校 里 的 计算 机 房 就 可 能 限制 每 天 游戏 程序 运行 的 次 数 。 

有 些 软 件 拥 有 者 使 用 诚信 机 制 来 限制 程序 的 使 用 ,他 们 把 许可 证 条 款 打 印 在 屏幕 上 或 
纸 上 并 要 求 用户 遵 守 协 约 。 其 他 的 则 使 用 特定 的 技术 来 实施 许可 证 条 款 


中 ”本 章 的 内 容 基 于 Lawrence deLuca 在 哈佛 职业 教育 学 院 担任 助教 期 间 编写 的 讲稿 ,该 讲稿 取材 于 他 参与 开发 的 


一 个 产品 。 
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一 种 实施 许可 证 技术 是 编写 程序 来 执行 许可 证 控制 。 通 常 的 做 法 是 设计 从 一 个 许可 证 
服务 器 获得 许可 的 应 用 程序 。 该 服务 器 是 一 个 进程 , 它 授权 应 用 程序 的 运行 。 
许可 证 服务 器 明确 许可 证 条 款 并 且 强 制 执行 该 条 款 , 如 图 13. 1 所 示 。 





图 13.1 许可 证 服务 器 给 予 许可 


请 求 许可 和 给 予 许可 需要 客户 和 许可 证 服务 器 之 间 的 通信 。 

许可 证 服务 器 是 如 何 工作 的 ?本章 将 学 习 一 个 具体 的 客户 /服务 器 许可 证 控制 模型 。 
通过 该 模型 的 学 习 , 可 以 接触 到 另外 一 种 类 型 的 socket 数据 报 socket, 另外 的 一 个 地 址 
域 一 一 Unix 域 , 一 个 维持 系统 状态 的 网 络 协议 ,以 及 其 他 一 些 有 关 设 计 安 全 健壮 的 客户 / 服 
务 器 系统 的 技术 。 








13.2 许可 证 控制 简 史 


软件 控制 技术 的 使 用 已 经 有 多 年 的 发 展 历史 了 。 

在 单机 版 的 个 人 计算 机 时 代 , 对 软件 的 限制 是 靠 特定 的 磁盘 或 由 隐匿 在 特定 磁道 上 的 
密码 来 实现 的 。 磁 盘 上 的 密码 很 难 被 复制 ,并 且 只 有 磁盘 在 驱动 器 中 的 时 候 程序 才能 运行 
如 果 磁 盘 丢 失 了 或 被 损坏 了 ,该 程序 将 不 能 再 运行 。 人 们 很 快 就 破解 并 找到 了 如 何 来 复制 
这 种 特殊 磁盘 的 方法 ,所 以 软件 厂商 发 明了 硬件 密 钥 。 硬 件 密 钥 是 一 个 适配器 , 它 可 以 插 在 
并 口 .串口 或 USB 口上 ; 被 许可 的 程序 只 有 在 发 现 该 适配器 的 时 候 才 能 运行 。 如 果 硬 件 密 
815 Ak ,程序 将 不 能 运行 。 

然而 网 络 计算 机 和 多 用 户 系 统 却 引起 了 新 的 问题 。 如 果 10 个 用 户 同时 想 运 行 计算 机 
或 网 络 上 的 同一 个 程序 ,那么 是 不 是 每 个 用 户 都 需要 在 服务 器 的 端口 上 插 一 个 硬件 密 铀 
WE? 软件 厂商 们 需要 一 种 可 靠 的 并 且 不 需要 给 合法 用 户 增 加 额外 负担 的 方法 来 实施 许可 
证 条 款 。 

网 络 和 多 用 户 系统 提供 了 一 种 新 的 解决 方法 ; 许可 证 服务 器 。 程 序 不 是 从 磁盘 或 密 铀 
取得 许可 ,而 是 从 服务 器 进程 取得 。 许 可 证 服务 器 被 一 台 计 算 机 上 多 个 用 户 共享 ,服务 器 进 
程 能 够 控制 程序 的 使 用 人 数 、 使 用 时 间 、 使 用 地 点 甚至 程序 的 使 用 方式 。 伴随 更 多 的 计算 机 
加 入 因特网 ,服务 器 控制 对 软件 和 数据 访问 的 需求 也 更 加 迫切 。 

本 章 中 的 许可 证 服务 器 将 实施 n 用 户 的 限制 。 也 就 是 说 ,服务 器 只 允许 特定 数量 的 程序 
实例 同时 运行 。 
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13.3 一 个 非 计 算 机 系统 实例 : 轿车 管理 系统 


一 个 公司 购买 了 许可 证 ,该 许可 证 限制 了 同时 使 用 程序 的 用 户 数 。 公 司 可 能 拥有 比 许 
可 证 所 人 允许 的 用 户 要 多 的 雇员 ,但 是 并 非 所 有 的 雇员 要 同时 使 用 程序 。 怎 样 的 一 个 设计 才 
能 满足 上 面 的 需求 呢 ? 

现实 世界 中 有 很 多 系统 ,通常 由 一 大 群 人 来 共享 其 中 的 资源 ,而 这 些 资源 是 有 限 的 。 这 
里 将 分 析 一 个 模型 : 雇员 共享 公司 轿车 的 问题 。 一 个 公司 拥有 特定 数量 的 轿车 ,同时 还 拥有 
更 多 数量 的 和 雇员。 如 何 控制 对 轿车 的 使 用 呢 ? 


13.3.1 轿车 钥匙 管理 描述 


控制 轿车 的 使 用 是 通过 控制 对 轿车 钥匙 的 访问 。 当 想 用 轿车 的 时 候 ,必须 先 得 到 一 把 
钥匙 。 如 果 在 钥匙 盒 中 没有 钥匙 了 ,将 不 能 使 用 轿车 。 如 果 有 可 用 钥匙 ,可 以 先 拿 一 把 铂 
时 ,签名 ,然后 使 用 轿车 。 使 用 完毕 后 ,把 钥匙 放 回 钥匙 盒 ,在 使 用 轿车 名 单 中 划 去 自己 的 名 
字 。 过 程 描述 如 图 13.2 所 示 。 


司机 钥匙 管理 员 钥匙 盒 ”一 定数 量 的 车 





13.2 控制 对 轿车 的 的 使 用 


签名 列表 有 何 作用 呢 ? 该 系统 的 目的 是 通过 控制 对 轿车 的 使 用 ,使 得 可 用 的 钥匙 一 直 
很 充足 。 人 并 非 是 完美 的 ,有 时 司机 会 忘记 归还 钥匙 。 钥 匙 管理 员 可 以 根据 签名 列表 找到 
该 司机 ,确定 他 是 否 仍 在 使 用 车 。 

轿车 使 用 管理 系统 是 控制 软件 使 用 的 一 个 现实 模型 。 在 将 该 系统 转换 成 软件 系统 之 
前 ,需要 更 为 详细 地 描述 该 系统 。 

钥匙 管理 系统 的 构成 如 下 : 

C1) 钥匙 管理 中 心 的 地 点 一 一 到 哪儿 可 以 获得 钥匙 

(2) 钥匙 管理 员 一 一 执行 策略 的 人 

(3) 钥匙 一 一 需要 得 到 的 东西 

(4) 签名 列表 一 一 保存 钥 是 和 找 回 钥匙 的 记录 


13.3.2. 用 客户 /服务 器 方式 管理 轿车 


在 给 出 轿车 钥匙 管理 系统 的 构成 后 ,下 面 将 用 客户 /服务 器 语言 来 描述 该 系统 。 
(1) 服务 器 和 客户 


谁 是 服务 器 和 谁 是 客户 ? 钥匙 管理 员 拥 有 司机 需要 的 钥匙 。 用 网 络 术 语 来 描述 ,钥匙 
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管理 员 是 服务 器 ,司机 是 客户 。 

(2) 协议 

所 用 的 协议 是 什么 ? 交互 的 事务 是 什么 ? 轿车 钥匙 管理 协议 包括 两 个 主要 的 事务 。 

。 获得 钥匙 

客户 : 你 好 ,我 需要 一 把 钥匙 。 

RA ae: 这 里 只 有 5 号 钥匙 ,没有 别 的 钥匙 了 。 

。 归还 钥匙 

客户 : 我 已 经 用 好 5 SHE. 

服务 器 : 谢谢 .。 

(3) 通信 系统 

省 户 和 服务 化 如 何 通信 ? 在 该 系统 中 ,人 们 通过 对 话 来 传递 简单 信息 。 

(4) 数据 结构 

司机 和 钥匙 管理 员 需 要 什么 样 的 数据 结构 呢 ? 钥 匙 管理 员 保 留 一 个 用 户 签 名 列表 ,一 
把 钥匙 对 应 列表 的 一 项 。 当 一 个 用 户 取 走 一 把 钥匙 ,钥匙 管理 员 在 该 项 记 下 用 户 的 名 字 , 当 
用 户 归 还 钥匙 时 ,管理 员 把 司机 的 名 字 从 列表 中 擦 去 。 下 表 解 释 了 用 户 签名 列表 : 








签名 列表 
$A et + 司 机 
1 adam(@ sales 
2 
3 carol@ support 
4 





如 果 在 签名 列表 中 没有 司机 与 钥匙 号 对 应 ,表示 该 钥匙 是 可 用 的 。 反 之 ,表示 不 可 用 。 
13.4 ”许可 证 管理 
本 节 将 钥匙 管理 系统 的 思想 运用 到 许可 证 管理 系统 中 。 


13.4.1 许可 证 服务 系统 : 它 做 些 什么 


图 13. 3 描述 了 人 们 试图 运行 许可 证 程序 的 过 程 。 工 作 如 下 : 
(OD HP! U 运行 被 许可 的 程序 Ps 
《2) 程序 P 向 服务 器 S 请 求 运行 许可 ; 

(3) IRS de Er 4 Bie TE P 的 用 户 数 ; 

(4) 如 果 上 限 未 达到 ,S 给 予 许可 ,程序 P 运行 ; 

(5) 如果 达到 上 限 ,S 拒绝 许可 ,程序 P 告 诉 U 稍 后 再 试 。 
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STAP 被 许可 程序 。” 许可 证 服务 器 





socket 


图 13.3 控制 软件 的 使 用 


许可 证 服务 系统 与 轿车 钥匙 服务 系统 稍 有 不 同 。 在 轿车 系统 中 ,司机 向 钥匙 管理 员 请 
求 许可 ; 而 在 这 里 ,程序 向 服务 占 请 求 许可 。 这 就 像 司机 请 求 轿车 ,而 轿车 向 钥匙 管理 员 请 
RAL. 

程序 的 创建 者 要 编写 所 有 的 程序 : 应 用 程序 和 服务 器 。 这 两 个 程序 作为 一 个 系统 。 服 
务 名 给予 应 用 程序 运行 许可 和 实施 许可 证 条 款 。 如 果 许 可 证 服务 器 不 在 运行 ,应 用 程序 将 
得 不 到 许可 ,不 能 运行 。 

这 里 以 轿车 钥匙 服务 系统 作为 模型 进行 了 讨论 。 那 么 如 何 将 这 种 思想 运用 到 软件 系统 
中 呢 ? 被 许可 程序 如 何 从 服务 器 得 到 许可 ? 服务 器 如 何 给 予 许可 ? 软件 系统 和 轿车 钥匙 系 
统 的 等 价 之 处 在 哪里 呢 ? 


13.4.2 许可 证 服务 系统 : 如 何 工 作 


(1) 票据 模型 

钥 古 管理 员 负 责 分 发 钥匙 ,许可 证 服务 器 发 布什 么 呢 ? 以 电影 院 和 棒球 场 为 例 , 付 钱 获 
得 进 场 许可 ,然后 得 到 一 张 人 场 票 据 。 与 此 类 似 ,这 里 的 许可 证 服务 器 发 布 的 是 数字 票据 。 
这 种 票据 又 是 什么 样子 的 呢 ? 客户 和 服务 器 交换 字符 串 , 所 以 票据 是 字符 串 ,其 格式 如 下 : 


pid. ticketnumber 例如 : 6589.3 


每 张 票据 包括 持 有 该 票据 进程 的 PID 以 及 票据 编号 。 在 票据 中 包含 PID 的 原因 其 实 就 
和 在 飞机 票 上 印 上 名 字 的 道理 是 一 样 的。 票据 中 的 PID 标识 票据 的 使 用 者 ,在 票据 丢失 时 ， 
可 以 帮助 找 回 票据 。 进 程 可 能 丢失 票据 吗 ? 

(2) 服务 器 和 客户 

谁 是 客户 和 谁 是 服务 器 ? 许可 证 服务 器 持 有 程序 需要 的 资源 : 票据 。 用 网 络 术 语 , 许 可 
证 服务 器 是 服务 器 ,而 应 用 程序 是 客户 。 

(3) 协议 

协议 是 什么 ? 交互 的 事务 是 什么 ? 这 里 的 票据 管理 协议 包括 下 面 的 两 个 主要 事务 : 


中 ”这 个 概念 并 不 难 理解 。 随 着 设备 越 来 越 先 进 ,连接 越 来 越 方 便 , 很 可 能 在 不 久 的 将 来 就 可 以 通过 你 的 收音 机 询问 
服务 器 是 否 有 播放 你 最 喜欢 歌曲 的 许可 。 
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。 获取 钥匙 

客户 : HELO mypid 

服务 器 : TICK ticketid or FAIL no tickets 

。 归还 钥匙 

客户 ; GBYE ticketid 

服务 器 : THNX message 

这 里 定义 了 基于 文本 的 协议 ,协议 中 使 用 了 4 个 字符 的 简单 命令 ,这 与 前 面 的 Web 服务 
器 所 用 的 命令 类 似 。 

(4) 通信 系统 

上 述 简 短 的 文本 信息 如 何在 客户 和 服务 器 之 间 传 送 ? 在 本 文 后 面 将 讨论 该 问题 。 

CO 数据 结构 

”客户 和 服务 秀之 间 所 用 的 数据 结构 是 什么 ? 这 里 使 用 整 型 数组 作为 签名 列表 。 数 组 的 

每 个 人 口 对 应 一 张 票据 。 关 一 个 客户 取 走 了 一 张 票 ,管理 员 将 客户 对 应 的 PID 写 到 该 人 口 。 
如 下 表 : 


签名 列表 
tick # process 
1 1234 
2 0 
3 6589 
4 0 


如 有 果 数 组 中 的 某 个 元 素 值 是 0, 表 明 该 票据 可 用 。 否 则 ,表明 该 票据 正在 被 使 用 。 
13.4.3 一 个 通信 系统 的 例子 


客户 如 何 请 求 票据 ? 服务 器 如 何 发 布 票据 ? 这 涉及 到 进程 间 的 通信 形式 。 客 户 和 服务 
仑 之 加 通过 短 消 息 通 信 。 服 务 顺 必须 接收 ,处 理 和 应 答 来 自 多 个 客户 的 请 求 。 目 前 ,哪些 技 
术 是 可 以 使 用 的 呢 ? 本 文 前 面 学 习 的 信号 和 管道 机 制 可 以 考虑 ,但 是 信号 太 短 了 ,而 管道 只 
连接 相关 联 的 进程 。 所 以 ,使 用 socket 是 最 明显 的 答案 。 而 对 于 socket, 也 有 两 种 不 同 的 选 
择 。 一 种 是 基于 流 的 socket, 它 是 用 来 连接 不 相关 的 进程 的 。 另 一 种 socket 被 称 为 数据 报 
socket ,或 称 为 UDP, 对 于 现在 的 项 目 , 这 种 socket 是 更 好 的 选择 。 


13.5 数据 报 socket 


流 socket 传送 数据 就 跟 电话 网 中 传送 声音 一 样 ,客户 先 建 立 连 接 ,然后 使 用 该 连接 进行 
单 向 、 双 向 或 类 似 管道 的 字 节 流传 送 。 

数据 报 通信 和 则 与 从 一 个 邮箱 到 另 一 个 邮箱 发 送 包 右 类 似 。 客 户 不 必 建 立 连接 ,只 要 向 
特定 的 地 址 发 送 消息 ,而 服务 器 进程 在 该 地 址 接收 消息 ，。 


Wai 
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流 socket 使 用 的 网 络 协议 叫 TCP 即 传输 控制 协议 (Transmission Control Protocol), 
数据 报 socket m] UDP 即 用 户 数据 报 协议 (User Datagram Protocol) 。 它 们 的 区 别 是 什么 
JE? 何 时 选择 何 种 socket 是 较 好 的 呢 ? 在 程序 中 如 何 使 用 数据 报 socket WE? 


13.5.1 流 与 数据 报 的 比较 


socket 是 如 何 工作 的 ? 数据 如 何在 Internet 上 传输 的 ? 当 用 户 向 流 socket 写 数据 时 ;内 
核 要 做 些 什 么 ? 这 与 向 数据 报 socket 写 数据 有 何 区 别 ? 

从 一 个 流 socket 传输 到 另 一 个 流 socket 的 数据 流 ,看 上 去 是 连续 的 .无 颖 的 ,实际 上 这 
征 一 种 错觉 。Internet 连接 要 把 数据 分 割 成 独立 的 数据 包 。 网 络 数据 传输 过 程 如 图 13.4 
所 示 。 





图 13.4 Internet 包 传 载 数 据 


在 现实 世界 中 ,有 很 多 将 一 大 块 数据 分 割 成 若干 较 小 的 数据 块 的 例子 。 假 设 要 通过 快 
BAIS 100 页 的 文档 。 当 快递 公司 要 求 你 使 用 只 能 装 20 页 的 信封 时 ,该 怎么 办 ? 可 以 把 文 
档 分 割 成 5 个 包 庄 ,每 个 单独 地 打包 和 附 上 地 址 。 然 后 把 这 5 个 独立 的 包 庄 放 到 邮箱 中 , 运 
- 输 系统 将 负责 把 它们 送 到 目的 地 。 在 接收 端 ,接受 者 打开 这 5 个 包 填 ,并 把 它们 按 顺序 重组 
成 原来 的 文档 。 

Internet 就 像 上 述 运输 系统 一 样 , 它 上 面 传输 的 数据 必须 符合 大 小 的 限制 。 大 块 的 数据 
锌 分 割 成 小 块 的 数据 来 传输 ,接收 端 必须 以 正确 的 顺序 重组 数据 块 。 但 通信 过 程 可 以 被 连 
接 和 中 断 ,如 图 13. 5 所 示 。 


Port 23 
103.123.45.67 
Internet, USA 





图 13.5 通信 可 以 被 连接 和 中 断 


流 socket 负责 分 割 、 排 序 、 重 组 的 所 有 工作 。 数 据 报 socket 则 不 会 。 下 表 给 出 了 它们 之 
间 的 区 别 。 
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TCP UDP 

x 数据 报 

分 片 /重组 否 

排序 否 

TT 可 能 未 到 达 
连接 的 多 个 发 送 者 


在 流 socket 中 ,内核 将 大 的 数据 块 分 割 成 带 编号 的 数据 片 。 位 于 接收 机 器 上 的 内 核 按 
顺序 接收 数据 片 ,重组 成 发 送 者 所 发 送 的 原始 数据 。 在 数据 报 socket 中 , 内核 并 不 给 数据 加 
编号 标签 ,在 目的 地 也 不 重组 。 

流 socket 对 传送 负责 ,数据 报 socket 则 不 。 流 socket 的 接收 端 检查 数据 片 的 顺序 来 确 
保 数 据 完整 到 达 。 接 收 端 提示 发 送 端 丢 失 的 数据 片 的 编号 ,并 等 待 丢 失 数 据 片 的 重 传 。 数 
据 报 socket 并 不 检查 丢失 数据 报 , 也 不 要 求 重 传 。 如 果 某 个 包 丢 失 在 Internet 中 , 它 只 是 不 
到 达 。TCP 比 UDP 做 更 多 的 工作 。UDP 更 快 .更 简单 ,给 网 络 较 少 的 负荷 。 

UDP 接收 消息 跟 邮 箱 系 统 方式 相同 : 发 送 者 将 你 的 地 址 写 在 信件 上 ,邮件 系统 负责 将 
信件 送 到 你 的 邮箱 中 ,然后 你 从 邮箱 中 取出 信 。TCP socket 需要 明确 调用 accept, read 和 
close 来 读 取 远 端 进程 的 消息 。 

UDP 正好 适合 这 里 的 应 用 。 客 户 发 送 短 消 息 来 获得 许可 ,服务 器 发 送 短 消息 给 予 或 拒 
绝 许可 。 客 户 和 服务 器 的 交互 不 需要 建立 连接 ,不 需要 分 片 和 重组 。 可 靠 性 甚至 是 不 要 的 。 
如 采 请 求 或 票据 丢失 ,客户 可 以 再 次 请 求 。 在 任何 事件 中 ,服务 器 和 客户 就 像 在 一 台 机 器 上 
或 者 一 个 网 络 的 同一 部 分 ,所 以 丢失 数据 报 的 风险 较 小 。 

UDP 对 于 Web 服务 器 和 e-mail 服务 是 一 个 较 差 的 选择 。Web 服务 器 和 e-mail 信息 可 
能 是 大 的 文件 ,这 些 字 节 流 必须 完全 和 按 序 到 达 目 的 地 。UDP 对 于 允许 丢失 帧 的 声音 和 视 
频 流 是 较 好 的 选择 。 


13.5.2 数据 报 编程 


数据 报 与 邮件 网 络 系 统 类 似 , 包 括 3 个 主要 部 分 : 目的 地 址 、 返 回 地 址 和 消息 ,如 图 13. 6 
Bt zh. 








图 13.6 数据 报 的 3 部 分 
数据 报 socket 可 以 被 理解 成 一 个 内 部 有 数据 的 盒子 ,发 送 者 给 出 目的 socket 的 地 址 。 


网 络 将 数据 从 发 送 者 发 送 到 目的 socket。 接收 进程 从 该 socket 中 读 取 数据 。 程 序 使 用 
sendto 上 友 送 数据 和 recvfrom 来 读 取 数据 ,如 图 13.7 所 示 ， 
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一 台 主 机 可 能 有 多 个 接收 socket, A socket 被 指派 给 
一 个 特定 的 端口 号 。 地 址 用 主机 上 的 端口 来 区 分 。 


图 13.7 使 用 sendto 和 recvfrom 


1. 接收 数据 报 
程序 dgrecv. c 是 一 个 简单 的 基于 数据 报 的 服务 器 。dgrecv. c 使 用 命令 行 传 过 来 的 端口 
号 建立 socket, 然 后 进入 循环 ,接收 和 打印 从 客户 端 发 来 的 数据 报 : 


[KKK HK KKK KKK KKK KKK KKK KKK KKK KKK KEK HK KKK KKK KK KKK KKK KKH XX 


x dgrecv.c — datagram receiver 


x usage: dgrecv portnum 
Q* action; listens at the specfied port and reports messages 
关 / 


i include <stdio.h> 

# include <stdlib.h> 

# include <sys/types.h> 
i include <sys/socket. hœ 
# include <(netinet/in. h^ 


+ define oops(m,x) { perror(m) ;exit(x) ;} 


int make_dgram_server_socket(int) ; 
int get internet address(char x , int, int * , struct sockaddr_in * ); 


void say who called(struct sockaddr in x ); 


int main(int ac, char x av[ ]) 


{ 


int port; /x use this port */ 

int sock ; /* for this socket x/ 

char buf[ BUFSIZ ] ; /* to receive data here «/ 

size t msglen; /x store its length here «/ 
struct sockaddr in saddr; /x put sender's address here */ 
socklen t saddrlen; /* and its length here x/ 

if (ac == 1 || (port = atoi(av[1])) <= 0 ){ 


fprintf(stderr, "usage; dgrecv portnumber\n") ; 
exit(1) > 
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) 
/* get a socket and assign it a port number */ 


if( (sock = make dgram server socket(port)) == -1) 


oops( "cannot make socket",2); 
/* receive messaages on that socket x/ 


saddrlen = sizeof(saddr); 
while( (msglen = recvfrom(sock,buf,BUFSIZ,0,&saddr,&saddrlen)) 70 ) 
| 
buf[msglen] = '\0'; 
printf("dgrecv; got a message; % s\n", buf); 
say who called(&saddr); 
} 


return 0; 


} 


void say who called(struct sockaddr in x addrp) 


{ 
char host[ BUFSIZ | ; 
int port; 


get internet address(host,BUFSIZ,&port,addrp); 
printf(" from; $ s; % d\n", host, port); 


辅助 图 数 make dgram server socket 和 get internet address 将 在 后 面 给 出 的 文件 dgram. c 
中 和 定义。 在 数据 报 socket 中 接收 消息 比 从 流 socket 接收 简单 。recvfrom 函数 阻塞 直到 数据 报 
到 达 。 当 数据 报到 达 时 ,消息 内 容 、 返 回 地 址 和 其 长 度 将 被 复制 到 缓存 中 。 

2. 发 送 数 据 报 

程序 dgsend. c 发 送 数据 报 。dgsend. c 创建 一 个 socket, 然后 用 它 发 送 消息 到 以 命令 行 
参数 传人 的 特定 的 主机 和 端口 号 。 


[XXX X HK KKK KKK KKK KEK KH HK HK KH KKH KK KKK XXX X XX XXX XX XOGXOXXOXXXXXXXXXX 


x dgsend.c ~ datagram sender 


x usage; dgsend hostname portnum "message" 
* action; sends message to hostname; portnum 
x/ 


i include <stdio.h> 

# include  «stdlib. h> 

# include «<sys/types.h> 
# include  «sys/socket. h> 
# include <Cnetinet/in.h> 


+ define oops(m,x) | perror(m);exit(3);) 
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int make dgram client socket(); 


int make internet address(char x ,int, struct sockaddr in *); 


int main(int ac, char x av[ ]) 


{ 


int sock; /* use this socket to send x/ 
char * msg; /x send this messag x/ 
struct  sockaddr in saddr; /* put sender's address here x/ 


if (ac ! * 4){ 
fprintf(stderr, “usage; dgsend host port 'message'\n"); 
exit(1); 


j 
msg = av[3]; 


/* get a datagram socket x/ 


if( (sock = make dgram client socket()) == -1) 


oops("cannot make socket",2); 
/* combine hostname and portnumber of destination into an address x/ 
make internet address(av[1], atoi(av[2]), &saddr) 
/* send a string through the socket to that address x/ 


if ( sendto(sock, msg, strlen(msg), 0, &saddr,sizeof(saddr)) == -1) 
oops("sendto failed", 3); 


return 0; 


sendto 函数 将 缓存 中 的 内 容 发 送 到 特定 地 址 的 socket, 
3. 辅助 函数 
创建 socket 和 socket 地 址 的 细节 被 封装 在 dgram. c 中 ， 


[HH KH KEK KH HH KH KKK KKH KE HHH HHH KH HH EK KKK HHH EHH KKH KKH KK HK KKK KEK HK KKH 
* dgram.c 
* support functions for datagram based programs 


x/ 


# include <stdio.h> 

# include <unistd.h> 

# include «<sys/types.h> 
# include <(sys/socket. h^» 
£ include <netinet/in. h> 
# include <arpa/inet. h> 
# include  «netdb. h> 

# include < string. h> 


# define HOSTLEN 256 
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int make internet address(); 


int make dgram server socket(int portnum) 


| 


j 


struct  sockaddr in saddr; /* build our address here x/ 
char hostname| HOSTLEN]; /x address x/ 
int Sock id; /* the socket x/ 


Sock id = socket(PF INET, SOCK DGRAM, 0); /x get a socket «/ 


if ( sock id == -1 ) return - 1; 
/** build address and bind it to socket xx/ 


gethostname(hostname, HOSTLEN); /x where am I ? x/ 


make internet address(hostname, portnum, &saddr); 


if( bind(sock id,(struct sockaddr x )&saddr, sizeof(saddr)) != 0) 


return —- 1; 


return sock id; 


int make dgram client socket() 


| 


j 


return socket(PF INET, SOCK DGRAM, 0); 


int make internet address(char x hostname, int port, struct sockaddr in x addrp) 


/* 
* constructor for an Internet socket address, uses hostname and port 


x (host,port) ~ > x addrp 


{ 


} 


struct hostent * hp; 


bzero((void x )addrp, sizeof(struct sockaddr_in)); 

hp = gethostbyname( hostname); 

if ( hp == NULL) return - 1; 

bcopy( (void x )hp- —h addr, (void x )&addrp- 7 sin addr, hp- œh length); 
addrp- — sin port = htons(port); 

addrp- —sin family = AF INET; 


return 0; 


int get internet address(char * host, int len, int x portp, struct sockaddr in x addrp) 


/x 
* extracts host and port from an internet socket address 
*x* addrp - > (host, port) 


{ 


strncpy(host, inet ntoa(addrp- >sin_addr), len); 
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x portp = ntohs(addrp- — sin port); 
return 0; 


j 


创建 一 个 数据 报 socket 与 创建 一 个 流 socket 类 似 。 其 不 同 点 在 于 ,这 里 设置 socket 的 
类 型 为 SOCK_DGRAM, ,而 且 不 要 调用 listen 函数 。 

4. 编译 和 测试 

$ cc dgrecv.c dgram.c - o dgrecv 

$ ./dgrecv 4444 & 

[1] 19383 

S cc dgsend.c dgram.c ~ o desend 

S ./dgsend host2 4444 "testing 123" 

dgrecv.got a message; testing 123 

from.10.200.75.200.1041 

S ps 

PID TTY TIME CMD 

14599 pts/3 00:00:00 bash 

19383 pts/3 00;00;00 dgrecv 

19393 pts/3 00,00,00 ps 

5 


编译 服务 器 ,并 启动 它 ,使 得 它 监 听 在 端口 4444。 然 后 编译 和 运行 客户 ,使 客户 发 送 字 
符 串 到 端口 4444。 服 务 器 接收 消息 ,打印 消息 ,并 且 打 印 消息 的 返回 地 址 。 客 户 socket 拥有 
主机 地 址 和 端口 号 ,内 核 随机 地 给 它 分 配 了 一 个 端口 号 1041。ps 进程 显示 了 服务 器 正在 
运行 。 


13.5.3 sendto 和 recvfrom 的 小 结 





sendto 


目标 从 socket 发 送 消息 


头 文件 # include «sys/types. h> 
# include « sys/socket. h> 





次 数 原 型 nchars = sendto(int socket, const void * msg, size_t len, int flags, const struct 
sockaddr * dest,socklen t dest len); 





参数 socket socket id 
msg 发 送 的 字符 类 型 的 数组 
len 发 送 的 字符 数 


dest JH [n] uv Xm socket 地 址 的 指针 
dest len. 地 址 长 度 


返回 值 一 ] 遇 到 错误 
nchars 发 送 的 字符 数 
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sendto 从 源 socket 发 送 数据 报到 目的 socket。 前 3 个 参数 与 write 的 参数 类 似 : BRK 
的 socket ,保存 要 发 送 字符 串 的 数组 以 及 发 送 的 字符 数 。 与 write 类 似 ,sendto 返回 实际 发 
送 的 字符 数 。flags 参数 表明 发 送 的 各 种 属性 ; 具体 可 参见 Unix 版 本 的 帮助 信息 。 最 后 两 
个 参数 给 出 发 送 目 的 地 的 socket 地址。 如 果 是 Internet 类 型 的 地 址 ,socket 地 址 包含 目的 主 
机 的 IP 地 址 和 端口 号 ,而 其 他 类 型 的 地 址 则 包含 其 他 的 成 员 。 








recvfrom 
Hf 从 socket 接收 消息 
头 文件 + include «sys/types. h> 
tt include «sys/socket. h> 
E dr m d nchars = recvírom(int socket, const void x msg, size_tlen, int flags, const struct 
sockaddr * sender,socklen t x sender. len); 
参数 socket socket id 
msg 字符 类 型 的 数组 
len 接收 的 字符 数 
flags 表示 接收 属性 的 比特 的 集合 ,0 表示 普通 


sender 指 回 远 端 socket 的 地 址 的 指针 
sender len Hb hb KC RE 





ix [n] (& 一 ] 遇 到 错误 
nchars 接收 的 字符 数 


recvirom 从 socket 读 取 数据 报 。 前 3 个 参数 与 read 类 似 : 所 要 读 取 的 socket. FMF 
符 的 数组 以 及 要 读 取 的 字符 数 。 与 read 类 似 ,recvfrom 返回 实际 接收 的 字符 数 。flags 指出 
了 接收 时 所 用 的 各 种 属性 ; 具体 可 参见 Unix 系统 的 帮助 信息 。 通 过 最 后 两 个 参数 ,可 以 获 
得 发 送 者 的 地 址 。 发 送 socket 的 地 址 将 被 存放 在 由 第 一 个 参数 指向 的 结构 中 ,地 址 长 度 存 
放 在 由 第 二 个 参数 指向 的 整 型 值 中 。 地 址 的 长 度 必须 提供 给 recvfrom BR; 如 果实 际 的 地 
址 是 不 同 的 长 度 , 它 将 更 改 该 值 。 如 果 第 一 个 参数 指针 为 空 值 ,发 送 者 地 址 将 不 被 记录 。 


13.5.4 数据 报应 答 

程序 dgsend. c 和 dgrecv. c 显示 了 如 何 从 客户 发 送 数据 给 服务 器 。 服务 器 如 何 给 客户 
发 送 应 答 呢 ? 在 现实 世界 中 ,假设 有 人 给 你 发 送 了 一 封 晚宴 的 邀请 函 ,你 将 如 何 给 出 答复 呢 ? 
这 很 简单 : REAA PERS E B 358 E B [Lf SEI T. 

程序 dgrecv2. c 从 客户 处 接收 消息 并 且 发 送 谢谢 作为 应 答 


fX XXX KK RK KE HK KK KKK KKH KKK XX XXX XX XXX XXX XX XX KKXXXXXXXXXXXX 


* dgrecv2.c — datagram receiver 


x usage: dgrecv portnum 
x action; receives messages, prints them, sends reply 
x/ 


# include <stdio.h> 
# include <Cstdlib. h> 
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# include  «unistd. h> 

# include «string. h> 

# include <(sys/types. h> 
# include <(sys/socket. h> 
i include <Cnetinet/in. h> 


# define oops(m,x) | perror(m) ;exit(x) ;} 


int make dgram server socket(int); 
int get internet address(char' ,int, int“ struct sockaddr in'); 
void say who called(struct sockaddr in x); 


void reply to sender(int,char x ,struct sockaddr in x , Socklen t); 


int main(int ac, char x av[ ] 


{ 


int port; /* use this port */ 

int sock; /* for this socket x/ 

char buf[ BUFSIZ |; /* to receive data here x/ 

size t msglen; /* store its length here x/ 
struct sockaddr in saddr; /* put sender's address here x/ 
Socklen t saddrlen; /* and its length here «/ 

if (ac == 1 || (port = atoi(av[1]) <= 0 ){ 


fprintf(stderr, "usage; dgrecv portnumber\n") ， 
exit(1); 
} 


/* get a socket and assign it a port number x/ 


if( (sock = make dgram server socket(port)) == -1 ) 


oops( "cannot make socket "12); 
/* receive messaages on that socket x/ 


saddrlen - sizeof(saddr); 
while( (msglen = recvfrom(sock,buf,BUFSIZ,0, &saddr,&saddrlen))7»0 ) { 
buf[msglen] = '\0'; 
printf("dgrecv; got a message: % s\n", buf); 
say who called(&saddr); 
reply to sender(sock,buf,&saddr,saddrlen); 


return 0; 


| 


void reply to sender(int sock,char * msg,struct Sockaddr in x addrp,socklen t len) 


( 
char reply[BUFSIZ + BUFSIZ]; 


sprintf(reply, "Thanks for your $% d char message\n", strlen(msg)); 
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sendto(sock, reply, strien(reply), 0, addrp, len); 
} 
void say who called(struct sockaddr in x addrp) 
{ 

char host[ BUFSIZ ] ， 

int port; 

get internet address(host,BUFSIZ,&port,addrp); 


printf(" from, % s, % d\n", host, port); 
} 


发 送 者 程序 当然 也 要 改变 以 接收 应 答 。 这 作为 练习 由 读者 来 完成 。 
13.5.5 数据 报 小 结 


数据 报 是 从 一 个 socket 发 送 到 另 一 个 的 短 消息 。 发 送 者 使 用 sendto 来 指定 消息 .长度 
和 目的 地 。 接 收 者 使 用 recvfrom 接收 消息 。 数 据 报 和 带 有 地 址 的 Internet 上 传输 的 数据 包 
的 基本 结构 接近 。 因 此 ,数据 报 给 内 核 网 络 功 能 和 网 络 流量 增加 的 负荷 较 少 。 由 于 数据 报 
可 能 在 传输 中 丢失 ,也 有 可 能 不 按 顺 序 地 到 达 , 所 以 它 通常 用 对 简单 和 高 效 的 要 求 比 完 整 性 
和 一 致 性 更 为 重要 的 应 用 中 。 

pm 种 简单 的 消息 传输 , 它 用 一 一 个 服务 器 来 接收 .处理 短 消息 和 发 
送 请 求 ,所 以 数据 报 是 一 个 合适 的 选择 。 


13.6 许可 证 服务 器 版 本 1.0 


下 面 , 回 到 许可 证 服务 器 项 目 上 来 。 这 里 的 服务 器 限制 了 程序 同时 运行 的 实例 数目 。 
当 用 户 要 运行 受 限 制 的 程序 时 ,该 进程 要 向 服务 器 请 求 运 行 许可 。 

如 有 条 并 没有 很 多 人 正在 用 该 程序 ,服务 器 发 送 票 据 给 进程 ,给 予 许可 证 。 如 果 达 到 了 最 
大 的 程序 实例 数 ,服务 器 发 送 无 可 用 票据 的 消息 给 客户 ,并 且 通 知客 户 稍 后 再 试 或 者 购买 支 
持 更 多 用 户 版 本 的 软件 。 被 许可 程序 和 服务 器 之 间 通 过 数据 报 来 通信 。 

客户 和 服务 器 的 运行 流程 及 其 交互 过 程 如 下 。 


cint Srv 





get tick 


wait for RQ 
recv RQ 
|| proc RQ 
reply to RQ 






do your 






work 
ret tick 
exit 







客户 和 服务 器 分 别 由 两 个 文件 组 成 : 短 的 文件 包含 main 函数 ,长 的 文件 包含 票据 管理 
盟 数 。 下 面 将 分 析 客 户 和 服务 器 程序 。 








第 13 章 ”基于 数据 报 (Datagram) 的 编程 : 编写 许可 证 服务 器 2 。 397 。 


13.6.1 客户 端 版 本 1 


fX COOLE KKK KKH KKK KKH K KH KKH KK EK HK KH KKK RK X XXX XXE 


* lcintl.c 
x License server client version 1 


* link with lclnt funcsi.o dgram.o 
*/ 


H include «stdio. h> 


int main(int ac, char x av[]) 


{ 
setup() ; 
if (get ticket() |= 0) 
exit(0); 


do regular work(); 


release ticket(); 
shut down(); 


j 


JC KR ER EK ICE XXX RH RHR XXE XXX HRM MEHR XX 
* do_regular_work the main work of the application goes here 

x/ 

do reqular work() 

{ 


printf("SuperSleep version 1.0 Running - Licensed Software\n") ; 


sleep(10); /* our patented sleep algorithm x/ 


客户 端的 最 上 层 代 码 遵 照 了 上 一 节 中 所 小 结 的 原则 。 客 户 得 到 票据 ,进行 处 理 , 释 放 票 
据 ,然后 退出 。 该 许可 证 例 程 是 Unix 中 sleep 程序 的 特殊 版 本 , 若 不 满意 标准 sleep 版 本 的 
工作 ,也 可 以 购买 许可 证 来 使 用 此 版 本 的 程序 。 当 然 还 要 运行 许可 证 服务 器 ,否则 该 sleep 
程序 将 拒绝 运行 。 其 中 辅助 函数 在 lclnt_funcsl. c rf, 


[XX KKK KKK KHER KK KH KK RK KKK EHR KK EK X X COX XXX XXX XX XX XX X XXX 


* lclnt funcsil.c,; functions for the client of the license server 


*/ 


# include <stdio. h> 

# include <sys/types. h> 
# include <sys/socket. h> 
# include <netinet/ in. h> 
# include <netdb. h> 














e 398 。 Unix/Linux 编程 实践 教程 





/* 

* Important variables used throughout 

*/ 
static int pid = -1; /* Our PID */ 
static int sd = -1; /* Our communications socket x/ 
Static struct sockaddr serv addr; /* Server address x/ 
static socklen t serv alen; /* length of address x/ 
static char ticket buf[128]; /* Buffer to hold our ticket «/ 
static have ticket - 0; /* Set when we have a ticket x/ 
+ define MSGLEN 128 /* Size of our datagrams x/ 

# define SERVER PORTNUM 2020 /* Our server’s port number x/ 
i define HOSTLEN 512 


+ define oops(p) { perror(p); exit(1) ; } 
char * do transaction(); 


/* 
* setup; get pid, socket, and address of license server 
* IN no args 
* RET nothing, dies on error 
x notes. assumes server is on same host as client 
x/ 
setup() 
( 
char hostname| BUFSIZ ]; 


pid = getpid(); /* for ticks and msgs x/ 
sd = make_dgram_client_socket(); /* to talk to server x/ 
if (sd == -1) 


oops( "Cannot create socket"); 
gethostname(hostname, HOSTLEN); /* server on same host x/ 
make internet address(hostname, SERVER PORTNUM, &serv addr); 


serv alen = sizeof(serv addr); 


shut down() 
1 
close(sd); 
j 
[RRR X X OX X XX X X X X X X X OR OR OX X X X OX X X X X XX HEE KER KKK OX X XO X E XOMOXORXRXXXXAXAXXXXXX 
x get ticket 
* get a ticket from the license server 
* Results; 0 for success, - 1 for failure 
*/ 
int get ticket() 
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char * response; 


char buf| MSGLEN |; 


if(have ticket) /* don’t be greedy x/ 
return(0); 

sprintf(buf, "HELO $d", pid); /* compose request x/ 

if ( (response = do transaction(buf)) == NULL ) 


return( ~ 1); 


/* parse the response and see if we got a ticket. 
* on success, the message is; TICK ticket ~ string 


* on failure, the message is; FAIL failure - msg 


*/ 
if ( strnomp(response, "TICK", 4) == 0 ){ 
strcpy(ticket buf, response * 5); /* grab ticket ~ id x/ 
have ticket = 1; /* set this flag «/ 
. narrate( "got ticket", ticket buf); 
return(0); 
} 
if ( strnemp(response, "FAIL",4) == 0) 


narrate( "Could not get ticket", response) ; 
else 


narrate( "Unknown message:", response): 
p ; 


f 


return( - 1); 


} /x get ticket x/ 
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[RK HHH KK KKK KH KK KKK KR KKK KH K HH KKH KEK KEK KR K EK KH KK KH XXX XXX X XXX XX 


* release ticket 
x» Give a ticket back to the server 


* Results, 0 for success, - 1 for failure 


int release ticket() 


{ 


char buf|MSGLEN]; 


char * response; 


if(! have ticket) /* don't have a ticket x/ 
return(0); /* nothing to release x/ 

sprintf(buf, "GBYE %s", ticket buf); - /* compose message x/ 

if ( (response = do transaction(buf)) == NULL ) 


return( - 1); 


/* examine response 


Tp bE EE oA EE ee Sf LR dL m m -a a 
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x success; THNX info ~ string 


x failure, FAIL error - string 


x*/ 

if ( strncmp(response, "THNX", 4) == 0 ){ 
narrate( "released ticket OK",""); 
return 0; 

} 

if ( strncmp(response, "FAIL", 4) == 0) 


narrate( "release failed", response + 5); 
else 

narrate( "Unknown message;", response); 
return( — 1); 


; /* release ticket x/ 


[RRR KH KKH KKK EEK KH KKH KE KKK KKK KKK EEK K RHEE KKK CX KH HK HK 
* do transaction 
* Send a request to the server and get a response back 
x IN msg p message to send 
* Results, pointer to message string, or NULL for error 
x NOTE; pointer returned is to static storage 
x overwritten by each successive call. 
* note; for extra security, compare retaddr to serv addr (why?) 
x/ 
char x do transaction(char x msg) 
1 
static char buf[ MSGLEN |; 
struct sockaddr retaddr; 
Socklen t addrlen = sizeof(retaddr); 


int ret; 


ret = sendto(sd, msg, strlen(msg), 0, &serv addr, serv alen); 
if (ret == -1)( 
syserr("sendto") ， 
return( NULL) ; 
} 
/* Get the response back x/ 
ret = recvfrom(sd, buf, MSGLEN, 0, &retaddr, &addrlen); 
if ( ret == -1)| 
syserr("recvfrom") ; 


return(NULL); 


/* Now return the message itself x/ 


return(buf); 





T ÉÀÁ—À 
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} /x do transaction x/ 


f/*X XX XX KH KKK KK HHH KH KH KE HK HE HHH KH RH KK HH KKK KKK KK XX XX XXX XXXXXxXXx xXx 
* narrate; print messages to stderr for debugging and demo purposes 
* IN msgl, msg2 ; strings to print along with pid and title 
* RET nothing, dies on error 
x/ 

narrate(char x msgl, char x msg2) 

{ 

fprintf(stderr, "CLIENT | %d]; &s %s\n", pid, msgl, msg2); 

} 

syserr(char x msgl) 

{ 

char buf[ MSGLEN | ; 
sprintf(buf,"CLIENT[ $d]: %s", pid, msgl); 
perror(buf); 


} 


get ticket 和 release_ticket 是 程序 中 的 主要 函数 。 它 们 都 遵循 下 面 的 规则 : 产生 短 请 
求 .发送 消 息 给 服务 器 .等 待 服务 器 的 应 答 ,然后 检查 应 答 和 根据 应 答 采 取 行 动 。 

get ticket 通过 发 送 命 令 HELLO 以 及 紧 跟 其 后 的 PID 来 请 求 票据 。 服 务 器 通过 发 送 
TICK ticket~id 接收 请 求 。 服 务 器 发 送 FAIL explanation 拒绝 请 求 。 

release- ticket 通过 发 送 命令 GBYE ticket-id 返回 票据 。 如 果 票 据 是 合法 的 ,服务 器 将 
发 送 THNX greeting 消息 作为 应 答 。 如 果 票 据 不 合法 ,服务 器 发 送 FAIL explanation 消息 。 

为 何 票据 可 能 是 不 合法 的 ? 本 文 的 后 面 将 讨论 该 问题 。 


13.6.2 服务 器 端 版 本 1 


[HK HK KR KKH KEK KK HK KH KK KH KK EK HK KK KKK KEK KE RHEE HK XX XX X X Y 3X XX X X 
* lservi.c 
* License server server program version 1 


x/ 


i include <stdio.h> 

# include <sys/types.h> 

# include <(sys/socket. h> 

# include <(netinet/in. h> 

# include < (signal. h> 

# include <(sys/errno. h> 

4 define MSGLEN 128 /* Size of our datagrams x/ 


int main(int ac, char x av[ l) 
{ 
struct sockaddr_in client_addr; 


socklen_t addrlen = sizeof( client addr) ; 
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char buf[ MSGLEN | ; 
int ret; 
int . sock; 


sock = setup(); 


while(1) | 


addrlen = sizeof(client addr); 


ret = recvfrom(sock,buf,MSGLEN,O,&client addr,&addrlen); 


if (ret!- ~1){ 
buff ret) = 'X0'; 
narrate("GOT;", buf, &client addr); 
handle request(buf,&client addr,addrlen); 


} 
else if ( errno ! = EINTR ) 


perror( "recvfrom"); 


| 





许可 证 服务 器 的 主 函 数 是 一 个 循环 ,主要 包括 接收 客户 请 求 ,处 理 请 求 和 发 送 应 答 。 其 


中 处 理 请 求 的 代码 包含 在 Iserv funcsl. c 文件 中 。 


[XXX XX XXX HHH HH KM KK KK KK RH KKK RK KEK KKK KEK HK HHH HHH KE HEHEHE XXX 


* lsrv funcsl.c 
x functions for the license server 


*/ 


# include  «stdio. h> 

# include <(sys/types. h> 
# include <(sys/socket. h> 
f include <netinet/in. h> 
# include «< netdb. h> 

i include «signal. b> 

# include «< sys/errno. h> 


# define SERVER_PORTNUM 2020 


+ define MSGLEN 128 
# define TICKET AVAIL 0 
+ define MAXUSERS 3 


# define oops(x) { perror(x); exit( — 1); } 


/* Our server’s port number x/ 
/* Size of our datagrams */ 
/* Slot is available for use x/ 


/* Only 3 users for us */ 


[RHR KK RH KK KR HK KKK KK KKK HK KR KKK HHH KKK HK KKH KKK HEHEHE KKH XXX XXX XX 


* Important variables 


x/ 
int ticket array| MAXUSERS]; /x Our ticket array */ 
int sd = -1; /* Our socket x/ 


int num tickets out = 0 


; /* Number of tickets outstanding */ 
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一 








char x do hello(); 
char * do goodbye() ; 


[RHR KK KKK HEE HHH ECC KHER KE HHH KH HHH HK KKH KH HK HK KH XX HHH EX 
* setup() - initialize license server 
x*/ 
setup() 
( 
sd = make dgram server socket(SERVER PORTNUM); 
if (sd == -1) 
oops( "make socket") ; 
free all tickets(O; 
return sd; 
; 
free all tickets() 
1 


int 1: 


f 


for(i=0; i<(MAXUSERS; i++) 


ticket array[ i] = TICKET AVAIL; 


[RK KKK RHE HK KKK KKK KKH KHMER KEKE KKK KHER KKK KEK RRR KKK KK KKK KKK KK KKH 
x shut down() - close down license server 
x/ 
shut down() 
close(sd); 


j 


[HR K HHH HK HER OCXOCXCCXOXCOXOCOXGO HK KKK HK KKK KKK KKH KH KE HEHEHE X€ XE 
x handie request(request, clientaddr, addrlen) 
* branch on code in request 
*/ 
handle request(char x req,struct sockaddr_in x client, socklen t addlen) 
| 
char * response; 


int ret: 


f 


/* act and compose a response x/ 

if ( strncmp(req, "HELO", 4) == 0) 
response = do hello(reqD; 

else if ( strnemp(req, "GBYE", 4) == 0) 
response = do goodbye(req); 

else 


response - "FAIL invalid request"; 
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/x send the response to the client x/ 
narrate("SAID;", response, client); 
ret = sendto(sd, response, strlen(response) ,0,client, addlen); 
if (ret == -1) 
perror( "SERVER sendto failed"); 


[X HK KK KKK KK HK HK HH KH KK KEKE HK HHH KK HR KKK HK HH EK HH K XXX X X aXX XXEXXXXX 
* do hello 
* Give out a ticket if any are available 
* IN msg p message received from client 
* Results; ptr to response 
* Note; returnis in static buffer verwritten by each call 
* NOTE; return is in static buffer overwritten by each call 
*/ 
char x do_hello(char * msg p) 
{ 
int x; 


static char replybuf[ MSGLEN] ; 


if(num tickets out >> = MAXUSERS) 
return( "FAIL no tickets available"); 


/* else find a free ticket and give it to client x/ 
for(x = 0; x<MAXUSERS && ticket array[x] ! = TICKET AVAIL; x++) ; 


/* À sanity check - should never happen x/ 
if(x == MAXUSERS) | 
narrate( "database corrupt", "" NULL); 
return( "FAIL database corrupt"); 


/* Found a free ticket. Record "name" of user ( pid) in array. 
* generate ticket of form. pid. slot 
x*/ 
ticket array[x] = atoi(msg p + 5); /x get pid in msg x/ 
sprintf(replybuf, "TICK $d. &d", ticket array[x], x); 
num tickets out ++ ; 
return(replybuf); 
} /x do hello x/ 


[RRR RHR HHH EEK EEE EEK KK HHH KKH EX REX 
* do goodbye 

* Take back ticket client is returning 

* IN msg p message received from client 


x Results: ptr to response 
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x Note, return is in static buffer over written by each call 
x / 

char * do goodbye(char x* msg p) 

{ 


int pid, slot; /* components of ticket x/ 


/* The user's giving us back a ticket. First we need to get 
* the ticket out of the message, which looks like; 
x 
x GBYE pid. slot 
x/ 
if((sscanf((msg p + 5), "%d. &d", &pid, &slot) ! = 2) || 
(ticket array|slot] 1= pid)) | 
narrate("Bogus ticket", msg p *5, NULL); 
return("FAIL invalid ticket"); 
} 


/* The ticket is valid. Release it. x/ 
ticket array|slot] = TICKET AVAIL; 


num tickets out-- ; 


/* Return response x/ 
return( "THNX See yal"); 
} /x do goodbye */ 


[RK HR HH KK KKK KKK KK KK KKK KKK KK HH KE HE HH XXX XX XX X X XX X XXXOOXOOXOXOXOX 
* narrate() ~ chatty news for debugging and logging purposes 
x/ 
narrate(char x msgl, char x msg2, struct sockaddr in x clientp) 
{ 
fprintf(stderr,"\t\tSERVER: %s $s ", msgl, msg2); 
if ( clientp ) 


fprintf(stderr,"( % s; $d)",inet ntoa(clientp- >sin_addr), 
ntohs(clientp - — sin port) ); 
putc('\n', stderr); 


f 


3 个 重要 的 函数 解释 如 下 。 

(1) handle request 

请 求 由 4 个 字符 的 命令 带 一 个 参数 构成 。 服 务 器 先 检查 命令 ,然后 调用 对 应 的 函数 。 即 
使 命令 不 合法 ,服务 器 也 必须 发 送 应 答 ,否则 客户 会 一 直 阻塞 下 去 。 

(2) do hello 

HELO 命令 用 来 请 求 票据 。 服 务 器 查找 票据 数组 寻找 空闲 的 项 。 如 果 某 项 的 PID 值 为 
0, 表 示 这 是 一 个 可 用 票据 。 服 务 器 使 用 独立 的 变量 num tickets out 来 节省 时 间 。 服 务 器 
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接收 请 求 后 ,可 以 通过 查找 表 来 寻找 空闲 项 ,而 该 变量 可 以 指明 何 时 表 已 经 满 了 ,这 样 就 不 
必 做 查找 了 。 

(3) do_goodbye 

GBYE 命令 是 返回 票据 的 请 求 。 票 据 是 一 个 由 PID 和 票据 编号 构成 的 字符 串 。 服 务 器 
将 票据 的 PID 和 票据 编号 与 签 出 列表 (sign 一 out list) 中 的 值 进行 比较 ,如 果 数 据 一 致 , 服 务 
句 从 签 出 列表 中 清除 该 项 的 值 并 且 致 谢 客户 。 如 果 不 一 致 , 则 一 定 是 什么 地 方 发 生 了 错误 。 

如 果 你 是 飞机 场 的 检票 员 , 如 果 某 个 客户 给 出 存根 的 编号 和 名 字 在 数据 库 中 不 存在 ,你 
就 可 能 会 问 :“ 你 是 从 哪里 得 到 这 张 票 的 ,你 是 谁 ?” 后 面 将 讨论 伪造 票据 问题 。 下 面 来 测试 
这 个 版 本 的 程序 


13.6.3 测试 版 本 1 
编译 服务 回 端 程序 并 在 后 台 运 行 


$ cc lservi.c lserv funcsi.c dgram.c - o lservi 
$ ./lservl& 
[1] 25738 


编 详 好 客户 端 程序 ,然后 同时 运行 4 个 实例 : 


$ cc lelntl.c lclnt funcsi.c dgram.c - o lclnti 
$ ./lclntl&./lclntl&./lclntl&./lclntl& 


SERVER; GOT; HELO 25912(10.200.75.200.1053) 
SERVER: SAID, TICK 25912. 0(10. 200. 75. 200.1053) 

CLIENT! 25912 | ;got ticket 25912.0 

SuperSleep version 1.0 Running Licensed Software 
SERVER; GOT; HELO 25913(10. 200. 75. 200.1054) 
SERVER; SAID; TICK 25913.1(10.200. 75. 200.1054) 

CLIENT[ 25913 ]:got ticket 25913.1 

SuperSleep version 1.0 Running - Licensed Software 
SERVER; GOT; HELO 25915(10. 200. 75. 200.1055) 
SERVER; SAID; TICK 25915. 2(10. 200. 75. 200.1055) 

CLIENT[ 25915 |.got ticket 25915.2 

SuperSleep version 1.0 Running - Licensed Software 
SERVER ; GOT; HELO 25914(10. 200. 75. 200.1059) 
SERVER; SAID; FAIL no tickets available (10. 200.75. 200-1059) 

CLIENT| 25914 ];Could not get ticket FAIL no tickets available (10. 200.75. 200;1059) 
SERVER; GOT; GBYE 25912. 0(10. 200. 75. 200;1053) 
SERVER, SAID; THNX See ya! (10. 200.75. 200-:1053) 

CLIENT[ 25912 ]: released ticket OK 
SERVER; GOT; GBYE 25913.1(10. 200. 75. 200:1054) 
SERVER; SAID, THNX See ya! (10. 200.75. 200.1054) 

CLIENT[ 25913 |; released ticket OK 
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SERVER: GOT: GBYE 25915.2(10. 200. 75.200:1055) 
SERVER; SAID: THNX See ya! (10.200.75. 200.1055) 
CLIENT| 25915 |; released ticket OK 


实际 运行 的 程序 可 能 有 非常 不 同 的 结果 。 尽 管 如 此 ,从 中 可 以 看 到 服务 器 如 何 接收 请 
AK .给 出 票据 以 及 客户 端 如 何 获取 票据 并 开始 工作 的 ; 可 以 看 到 进程 25914 没有 得 到 票据 。 
因为 在 该 进程 出 现时 ,所 有 的 票据 都 已 经 被 占用 了 ,而 之 前 进程 25915 却 得 到 了 一 张 票 据 。 
如 果 运 行 该 程序 多 次 ,可 能 会 看 到 不 同 的 结果 。 


13.6.4 进一步 的 工作 


版 本 1 的 许可 证 服务 器 可 以 很 好 地 工作 了 : 服务 器 处 理 请 求 并 且 维持 持 有 票据 的 进程 
列表 。 客 户 可 以 从 服务 器 得 到 票据 。 现 在 为 止 一 切 都 正常 。 看 起 来 这 非常 理想 。 不 过 现实 
世界 并 不 总 这 样 美好 ,软件 及 其 使 用 者 并 不 完全 是 你 所 期 望 的 那样 。 可 能 出 现 什 么 错误 呢 ? 
该 如 何 处 理 这 些 错误 呢 ? 


13.7 ”处理 现实 的 问题 


这 里 的 许可 证 服务 器 能 很 好 地 工作 ,前 提 是 所 有 的 进程 是 正常 工作 的 。 有 时 ,软件 可 能 
运行 出 错 。 如 果 SuperSleep 程序 被 另外 一 个 用 户 杀 死 了 ,或 者 程序 发 生 段 存 取 错误 而 被 内 
核 杀 死 了 ,该 如 何 呢 ? 对 于 它 所 占用 的 票据 该 如 何 处 理 呢 ? MNRAS ah hte C/E AV? 在 
服务 器 重启 后 又 将 发 生 什 么 呢 ? 

现实 世界 中 的 程序 必须 能 够 处 理 异 常 户 泪 。 这 里 考虑 两 种 情形 : 客户 端 月 演 和 服务 器 
BM. 

13.7.1 处 理 客户 端 骨 溃 | 
On Fe AEP yug B ur ,客户 将 不 会 归还 票据 ,如 图 13. 8 所 示 。 


签 出 列表 中 死 进 
es | 程 对 应 的 条 目 


QU FR AHAA 
将 不 会 返回 票据 





图 13.8 客户 不 归还 票据 


在 出 租车 公司 里 ,雇员 可 能 辞职 .被 解聘 、 回 家 或 死亡 ,但 仍 持 有 公司 轿车 的 钥匙 。 这 些 
对 公司 将 造成 什么 影响 呢 ? 签 出 列表 指明 票据 仍 被 占用 。 其 他 进程 就 不 能 得 到 该 票据 。 但 
是 ,如 采 有 足够 多 的 进程 衣 溃 , 签 出 列表 就 可 能 虽然 满 了 ,但 此 时 却 没 有 运行 的 客户 程序 。 

钥匙 管理 员 通 过 给 持 有 钥匙 的 人 打 电 话 ,就 可 以 收回 钥匙 。 他 可 以 定期 地 浏览 签 出 列 
表 , 然 后 给 每 个 司机 打 电 话 ， 你 仍 在 使 用 车 吗 ?”。 如 果 无 人 响应 ,管理 员 把 他 的 名 字 从 签 出 
列表 中 划 去 .管理 员 检 查 的 频率 越 高 , 签 出 列表 的 精确 性 就 越 高 。 
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许可 证 服务 器 可 以 使 用 相同 的 技术 ,定期 检查 票据 数组 ,确认 其 中 的 每 个 进程 是 否 还 活 
着 ? 如 果 某 个 进程 已 经 不 存在 了 ,服务 器 可 以 把 该 进程 从 数组 中 去 除 ,释放 其 占用 的 票据 。 
检查 程序 运行 的 越 频繁 ,数组 的 精确 性 越 高 。 

l. 收回 丢失 的 票据 : 调度 

服务 器 中 如 何 增加 收回 票据 的 代码 ? 如 何 调用 这 些 代 码 ? 服务 器 必须 实现 两 个 独立 的 
操作 : 等 待 客户 的 请 求 , 同时 周期 性 地 收回 丢失 的 票据 。 而 调度 行为 是 简单 的 : 只 要 使 用 
alarm 和 signal 技术 来 周期 地 调用 一 个 函数 。 在 前 面 章节 的 移动 文字 例子 中 ,使 用 了 这 种 技 
术 。 修 订 的 程序 流程 如 图 13. 9 所 示 。 


main () 
Beta) 


^ i darm 
Mb LASS 
EARL id iri. 


MER 
1H 求 | 
————— n ticket recla 
oy Se IT ui en ta ur TT a oy eS ia er Fe adc ver 
ii at 24 ES = PY ia IP. ua = SPEI icones re i 
Wes A men my mde H Ip, TIRAS i set E E an i dietus 
MYA [2 oN Sead Rees ~ PO OEA E aa E eit cid dimidia 





”图 13.9 使 用 alarm 来 调度 票据 消除 程序 


在 设计 需 同时 处 理 两 件 事 情 的 程序 时 ,必定 要 考虑 函数 之 间 的 冲突 。 如 果 服 务 器 正在 
处 理 客户 请 求 的 同时 ,被 SIGALAM 信号 触发 调用 回收 丢失 的 票据 的 函数 ,会 产生 问题 吗 ? 
这 两 个 处 理 函数 共享 变量 或 者 数据 结构 吗 ? 显然 是 的 ,发 放 票 据 需 要 修改 签 出 列表 ,而 收回 
票据 也 需要 修改 签 出 列表 。 这 种 冲突 可 能 会 破坏 数据 的 一 致 性 吗 ? 该 问题 留 作 课 后 练习 。 
考虑 到 安全 性 ,在 处 理 请 求 的 时 候 关 闭 alarm。 

2. 收回 丢失 的 票据 : 编程 

服务 器 希望 能 回收 已 经 不 存在 进程 的 票据 。 那 么 如 何 判断 进程 是 否 还 活着 呢 ? 可 以 使 
用 popen 来 运行 ps, 然 后 从 ps 的 输出 中 查找 PID, 以 确定 持 有 票据 的 PID 是 否 存 在 。 另 一 
种 快速 简洁 的 方法 是 使 用 kill 系统 调用 的 特殊 功能 。 

可 以 通过 给 进程 发 送 编号 为 0 的 信号 以 确定 它 是 否 存在 。 如 果 进 程 不 存在 ,内 核 将 不 会 
发 送信 号 ,而 是 返回 错误 并 设置 errno 为 ESRCH。 在 ticket reclaim 中 使 用 了 该 特征 ,该 函 
数 在 lserv_funcs2. c 文件 中 : 


# define RECLAIM INTERVAL 60 / * reclaim every 60 seconds */ 
[KKK KKH KKK HHH CG GG C KK KKH HHH HHH HK KKK HH HH KE KKH KKH KH HHH XXX XX HH HHH 
* ticket_reclaim 
* go through all tickets and reclaim ones belonging to dead processes 
* Results: none 
x/ 
void ticket reclaim() 


{ 


—————————————————————————————————— a: 
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int i; 
char tick[ BUFSIZ |; 
for(i = 0; i < MAXUSERS; i++) | 
if((ticket array[i] | = TICKET AVAIL) && 
(kill(ticket array[i], 0) == -1) && (errno == ESRCH)) { 
/* Process is gone - free up slot x/ 
sprintf(tick, "Sd. *d", ticket array[i],i); 
narrate( "freeing", tick, NULL); 
ticket array[i] = TICKET AVAIL; 


num tickets out-- ; 


j 
alarm(RECLAIM INTERVAL); /x reset alarm clock x/ 


j 


接 下 来 ,在 main 函数 中 增加 调度 回收 票据 的 函数 ,并 在 正常 操作 中 关闭 alarm。 修 改过 
的 main 在 文件 lserv2. c H, 


int main(int ac, char x av| |) 
1 
struct sockaddr client addr; 
Socklen t addrlen- sizeof(client addr); 
char buf| MSGLEN | ; 
int ret, sock; 
void ticket reclaimO; /* version 2 addition x/ 


unsigned time left; 


sock = setup(); 


signal (SIGALRM, ticket reclaim); /* run ticket reclaimer x/ 
alarm(RECLAIM INTERVAL); /x after this delay x/ 
while(1) ( 


addrlen - sizeof(client addr); 
ret = recvfrom(sock,buf,MSGLEN,O,&client addr,&addrlen); 
if ( ret 1= —1)( 
buf[ ret] = 'XO'; 
narrate("GOT;", buf, &client addr); 
time left = alarm(0); 
handle request(buf,&client addr,addrlen); 
alarm(time left); 
} 
else if ( errno ! = EINTR ) 
perror("recvfrom") ; 


} 
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通过 上 面 的 修改 ,许可 证 服务 器 就 可 以 周期 性 地 检查 票据 了 。 确 实 需要 这 样 周期 性 地 
检查 吗 ? 为 什么 不 只 在 票据 列表 满 了 并 且 有 客户 的 请 求 被 拒绝 的 时 候 检查 呢 ” 这 样 会 更 
ff ny ? 


13.7.2 ”处理 服务 器 崩溃 


服务 右 朋 演 通 常 有 两 个 严重 的 后 果 。 首 先 , 签 出 列表 丢失 ,失去 进程 持 有 票据 的 记录 。 
其 次 ,新 客户 不 可 以 再 运行 ,因为 分 发 许可 证 的 程序 已 经 不 存在 。 最 简单 的 解决 方法 是 重新 
启动 服务 器 ,如 图 13.10 所 示 。 


JC BU FR 25 di 
发 布 的 票据 


新 启动 的 服 
Fem: Beth 
列表 为 空 





重 司 服务 器 使 得 新 的 客户 可 以 运行 ,但 会 带 来 两 个 新 的 问题 。 

自 先 ,重启 服务 器 的 票据 数组 是 空 的 ; 服务 器 含有 新 的 未 被 取 走 的 票据 列表 。 崩 演 的 服 
务 仑 的 票据 数组 可 能 已 经 满 了 ,而 重启 服务 器 仍 给 其 他 客户 发 送 许 可 。 这 样 重复 地 关闭 服 
务 右 ,再 重启 服务 器 就 像 印 钞 机 一 样 可 以 产生 更 多 的 票据 。 

其 次 , 持 有 旧 的 服务 器 的 票据 的 客户 在 归还 票据 时 ,将 会 被 认为 是 伪造 票据 。 

1. 票据 验证 

上 述 问题 的 一 个 解决 方法 是 票据 验证 。 票 据 验 证 表示 每 个 客户 周期 性 地 向 服务 器 发 送 
慰 据 的 副本 。 客 户 发 送 数据 包 , 对 服务 器 说 :“ 这 是 我 的 票据 。 是 合法 的 吗 ?”, 如 图 13. 11 
所 示 、 


ts 





epee ie 


13.11 客户 验证 票据 


票据 含有 数组 编号 和 PID。 服 务 器 检查 签 出 列表 。 如 果 该 项 为 空 ,服务 器 可 以 认为 该 
票据 是 自己 先前 的 实例 赋予 的 。 服 务 器 将 会 把 该 票据 加 到 列表 中 。 逐 步 地 ,客户 提供 票据 
来 验证 , 签 出 列表 被 重新 填 人 。 

服务 大 重 建 签 出 列表 解决 了 表 丢 失 问题 ,但 可 能 导致 其 他 问题 。 如 果 一 个 新 的 客户 在 
表 重 建 好 之 前 ,请求 票据 ,服务 器 可 能 分 发 一 个 已 经 给 予 其 他 客户 的 票据 给 该 客户 。 当 持 有 
日 的 票据 的 客户 对 其 票据 进行 验证 时 ,服务 器 会 拒绝 它 。 
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男 一 种 方法 是 服务 器 拒绝 表 中 没有 的 所 有 的 票据 。 持 有 被 拒 票 据 的 客户 尝试 再 申请 新 
的 。 这 种 方法 是 否 更 好 ? 

2. 协议 中 增加 验证 

票据 验证 是 协议 中 的 一 个 新 的 事务 : 


CLIENT: VALD tickid 
SERVER; GOOD or FAIL invalid ticket 


这 里 必须 改变 客户 和 服务 器 以 支持 验证 。 
3. 客户 端 增 加 验证 
客户 端 增加 验证 ,需要 编写 一 一 个 函数 并 在 主 函数 中 调用 它 ,其 流程 如 图 13.12 所 示 。 


cint 


HELO pid -一 一 一 一 一 
2 TICK tickid 


GBYE tickid-———— 
— —— THNX 


VALD ticki dn 





图 13. 12 客户 定期 验证 票据 


客户 可 以 根据 系统 的 需要 以 一 定 的 间隔 定期 验证 票据 ,可 以 设置 一 个 计时 器 来 定期 验 
证 。 如 有 果 客 户 是 一 个 电子 制 表 程序 ,验证 可 以 在 一 定量 的 计算 结束 后 进行 。 一 个 许可 证 服 
务 器 会 响应 验证 请 求 。 

SuperSleep 客户 程序 可 以 把 10 秒 的 睡眠 时 间 分 割 成 两 个 5 秒 ,在 这 期 间 进行 验证 。 这 
作为 课 后 练习 。 

4. 服务 器 端 增加 票据 验证 

服务 器 端 增加 验证 需要 做 两 处 改动 。 改 动 后 的 程序 位 于 新 的 文件 lserv_funcs2. c 中 。 
首先 ,增加 一 个 函数 来 验证 票据 : 


[HH HHH KH HH IHR HK HK HK HK KK HE HK HK HK HH WH HK RHE K KRM RRR RHR HER HERR 
* do validate 
* Validate client's ticket 
* IN msg p message received from client 
* Results; ptr to response 
* NOTE; return is in static buffer overwritten by each call. 
x/ 
static char x do validate(char x msg) 
{ 


int pid, slot; /* components of ticket x/ 


/* msg looks like VALD pid. slot — parse it and validate x/ 
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if (sscanf(msg+5,"%d. $ d", &pid,&slot) 2-22 && ticket array[slot] == pid) 
return("GOOD Valid ticket") ; 


/* bad ticket */ 
narrate("Bogus ticket", msg * 5, NULL); 
return("FAIL invalid ticket"); 


HX , handle request 中 增加 更 多 的 判断 。 


handle request(char x req,struct sockaddr in x client, socklen t addlen) 


{ 


char * response; 


int ret; 


/x act and compose a response x/ 


if ( strncmp(req, "HELO", 4) == 0) 
response = do hello(req); 

else if ( strncmp(req, "GBYE", 4) == 0) 
response = do goodbye(req) ; 

else if ( strnomp(req, "VALD", 4) == 0) 
response = do validate(req); 

else 
response = "FAIL invalid request"; 


/* send the response to the client x/ 
narrate("SAID;", response, client); 
ret = sendto(sd, response, strlen(response),0, client, addlen); 
if (ret == -1) 
perror( "SERVER sendto failed"); 


13.7.3 测试 版 本 2 


现在 可 以 编译 和 测试 新 版 本 的 客户 和 服务 器 了 。 测 试 包含 了 杀 死 客户 和 服务 器 以 及 重 
月 客户 和 服务 器 。 试 观察 输出 中 的 进程 ID 和 消息 。 为 了 便于 测试 ,客户 睡眠 时 间 为 两 个 15 
秒 的 间隔 ,服务 髓 每 5 秒 尝 试 回收 票据 。 结 果 如 下 : 


$ cc lserv2.c lserv funcs2.c dgram.c - o lserv2 


$ cc lclnt2.c lelnt funcs2.c dgram.c - o lclnt2 


$ ./lserv2k # Jah 1 个 服务 器 
[1 130804 
$ ./lelnt2&./lclnt2&./lclnt2& 间 启 动 3 个 客户 端 
[2]30805 


[3]30806 
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[4130807 
S SERVER. GOT; HELO 30805 (10.200.75.200;1085) 
SERVER; SAID: TICK 30805.0 (10. 200. 75.200,1085) 
CLIENT [ 30805 ]:got ticket 30805. 0 
SuperSleep version 1.0 Running - Licensed Software 
SERVER; GOT; HELO 30806 (10.200.75.200;,1086) 
SERVER; SAID; TICK 30806. 1 (10. 200.75. 200:1086) 
CLIENT | 30806 |; got ticket 30806. 1 
SuperSleep version 1.0 Running - Licensed Software 
SERVER; GOT; HELO 30807 (10.200.75.200,1087) 
SERVER; SAID; TICK 30807.2 (10.200. 75. 200:1087) 
CLIENT [30807 ] ,got ticket 30807.2 
SuperSleep version 1.0 Running - Licensed Software 
$ kill 30806 #kill 一 个 客户 
[3]- Terminated . /1clnt2 
SERVER; freeing 30806. 1 
SERVER; GOT; VALD 30805.0 (10.200.75.200,1085) 
SERVER: SAID; GOOD Valid ticket (10.200.75.200,1085) 
CLIENT [ 30805 |; Validated ticket, GOOD Valid ticket 
SERVER; GOT . VALD 30807. 2 (10. 200.75. 200.1087) 
SERVER; SAID; GOOD Valid ticket (10. 200.75. 200.1087) 
CLIENT [30807], Validated ticket. GOOD Valid ticket 
$ kill 30804 #kill 服务 器 


[1]Terminated . /lserv2 

$ ./lserv2& t Ji p UHR A 
[5]30808 

S 


SERVER;GOT. GBYE 30805.0 (10.200.75.200,1085) 

SERVER: Bogus ticket 30805.0 

SERVER; SAID; FAIL invalid ticket (10.200.75.200,1085) 
CLIETN| 30805 ] ; release failed invalid ticket 

SERVER; GOT: GBYE 30807.2 (10.200. 75.200.1087) 

SERVER; Bogus ticket 30807. 2 

SERVER; SAID; FAIL invalid ticket (10. 200.75. 200.1087) 
CLIETN[ 30807 |; release failed invalid ticket 
$ ./lelnt2 JH Jüsb— T3089) 2 

SERVER, GOT; HELO 30809 (10.200.75.200,10857 

SERVER; SAID; TICK 30809.0 (10.200.75.200.1087) 
CLIENT [30809].got ticket 30809.0 
SuperSleep version 1.0 Running - Licensed Software 

SERVER; GOT : VALD 30809.0 (10.200.75.200.1087) 

SERVER; SAID; GOOD Valid ticket (10.200.75.200,1087) 
CLIENT [30809]. Validated ticket, GOOD Valid ticket 

SERVER; GOT, GBYE 30809.0 (10.200.75.200.1087) 
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SERVER; SAID; THNX See ya! (10.200.75.200:1087) 
CLIENT [30809 ]: release ticket OK 


[2] Done . /1clnt2 
[4]- Done . /1clnt2 
$ ps 

PID TIY TIME CMD 


23509  pts/3 00:00:00 bash 
30808  pts/3 00.00.00 lserv2 
30810 pts/3  00;00,00 ps 

$ 


看 起 来 还 不 错 。 不 妨 试 一 下 上 述 程序 ,观察 其 中 的 交互 过 程 。 


13.8 分 布 式 许可 证 服务 器 


许可 证 服务 器 和 被 许可 程序 通过 socket 进行 通信 ，socket 可 以 连接 不 同 主机 上 的 进程 ， 
理论 上 ,与 Web 服务 器 和 客户 运行 在 不 同 主机 上 类 似 ,这 里 的 客户 可 以 运行 在 一 台 机 器 上 ， 
而 服务 器 运行 在 另 一 台 机 器 上 。 当 它们 运行 在 不 同 的 机 器 上 时 ,会 有 问题 吗 ? 是 的 。 

。 问题 1: 重复 的 进程 ID 

进程 ID 在 一 台 机 器 上 是 惟一 的 ,但 在 不 同 主机 上 的 进程 可 能 拥有 相同 的 进程 ID。 图 
13. 13 说 明 的 情况 不 含有 任何 错误 且 很 常见 。 


许可 证 服务 器 





图 13.13 跨 网 络 PID 不 惟一 


存放 票据 的 表 中 含有 PID 和 票据 编号 。 在 图 13. 13 的 情况 中 ,许可 证 服务 将 认为 给 同 
一 个 进程 分 配 了 3 张 票 。 每 个 进程 只 要 一 张 票 就 可 以 运行 ,所 以 这 是 错误 的 。 请 求 更 多 的 票 
据 , 可 以 被 认为 是 客户 端的 一 个 漏洞 。 

这 里 可 以 扩展 票据 表 项 的 格式 和 内 容 , 使 其 包含 标识 运行 程序 的 主机 从 而 解决 重复 PID 
问题 。 

S 问题 2 : 回收 票据 

服务 器 通过 调用 kill(pid,0) 命 令 向 客户 回收 票据 。kill(pid, 0) 发 送信 和 号 0 给 持 有 票据 
的 进程 。 通 过 修订 过 的 票据 表 , 服 务 器 现在 可 以 知道 客户 运行 在 哪 台 主机 上 

但 是 ,服务 器 不 能 给 其 他 机 器 上 的 进程 发 送信 号 ,如 图 13.14 Bo, 如 果 许 可 证 服务 器 
想 给 主机 3 上 的 进程 发 送信 号 ,服务 器 必须 产生 主机 3 上 的 请 求 。 
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图 13.14 进程 不 能 给 其 他 主机 发 送信 和 号 


为 什么 不 在 每 台 机 器 上 都 运行 一 个 服务 器 的 实例 ”如 图 13. 15 所 示 ,每 个 本 地 的 服务 
化 可 以 监控 丢失 的 票据 。 


许可 证 服务 器 许可 证 服务 器 。 许可 证 服务 器 





13.15 运行 本 地 复制 的 lserv 


本 地 服务 器 解决 了 向 主机 发 送信 号 的 问题 ,但 是 又 带 来 新 的 问题 : 哪个 服务 器 发 布 票 
Ji? 主 服务 器 如 何 和 本 地 服务 器 通信 ? 客户 把 票据 发 给 谁 验证 ? 

。 问题 3: EPL ARM 

如 果 其 中 的 一 台 机 器 停止 运行 ,将 会 发 生 什 么 ?》 主 服务 器 如 果 还 在 运行 的 话 ,如 何 收回 
票据 ? 客户 端 程序 如 何 验证 票据 ?如 果 运 行 主 服务 器 的 主机 停止 运行 , 谁 来 分 发 票据 ? 

如 何 建立 一 个 分 布 式 许可 证 系统 来 同时 支持 多 台 机 器 ? 这 里 有 3 种 方法 。 试 考虑 它们 
的 设计 细节 以 及 优 缺 点 ,并 考虑 当 客 户 、 服 务 器 .计算 机 或 者 网 络 甬 溃 时 每 个 方案 的 后 果 。 

”方法 1: 客户 端 服务 器 和 中 央 服 务 器 通信 

台 机 器 都 有 一 个 本 地 服务 器 ,就 像 本 文 编写 的 那样 。 每 个 客户 跟 本 地 的 服务 器 通信 。 

本 地 服务 器 把 请 求 转发 给 中 央 服 务 器 。 中 央 服 务 器 返回 票据 或 者 拒绝 。 本 地 服务 器 记录 并 
把 应 答 转 发 给 客户 。 本 地 服务 器 也 可 以 强制 执行 一 些 对 本 地 客户 的 限制 ,例如 该 机 器 上 可 
以 运行 的 程序 实例 数 ,或 者 程序 可 以 运行 的 时 刻 。 | 

”方法 2: 每 个 客户 都 和 中 央 服 务 器 通信 

客户 直接 给 特定 主机 上 的 服务 器 发 送 请 求 。 本 地 服务 器 运行 在 每 个 主机 上 ,但 这 些 服 
务 骨 不 和 客户 通信 ,它们 在 重新 声明 票据 的 时 候 作 为 中 央 服务 器 的 代理 。 

”方法 3: 客户 服务 器 和 客户 服务 器 通信 

每 台 机 器 都 有 本 地 服务 器 ,每 个 客户 跟 本 地 服务 器 通信 。 没 有 中 央 服 务 器 。 所 有 的 本 
地 服务 器 间 互 相通 信 。 每 次 一 个 客户 请 求 时 ,本 地 服务 器 询问 其 他 所 有 的 服务 器 目前 已 经 
Hii T 2 7b ok SR 如 果 所 用 票据 数 小 于 所 允许 的 总 数 ,本 地 服务 器 分 配 一 张 票据 给 客户 。 
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13.9 Unix dX socket 


本 章 的 许可 证 服务 器 中 的 socket 使 用 标准 的 主机 ID 和 端口 号 地 址 系统 。 使 用 这 些 
Internet 地 址 ,服务 器 可 以 接收 本 地 的 乃至 更 大 网 络 上 机 器 的 客户 请 求 。 

在 上 述 的 两 种 分 布 式 许 可 证 服务 器 模型 中 ,客户 只 需 和 同一 台 主 机 上 的 服务 器 通信 。 
socket 只 能 用 在 仅 限 于 主机 内 部 的 通信 中 吗 ? 


13.9.1 文件 名 作为 socket 地 址 


有 两 种 连接 : 流连 接 和 数据 报 连接 ,也 有 两 种 socket 地 址 : Internet 地 址 和 本 地 地 址 。 
Internet 地 址 包含 主机 ID 和 端口 号 。 本 地 地 址 通常 叫做 Unix 域 地 址 , 它 是 一 个 文件 名 ( 例 
如 /dev/log、/dev/printer 或 /tmp/lserversock) ,没有 主机 和 端口 号 。 

两 个 socket 名 /dev/log 和 /dev/printer 被 用 在 很 多 Unix 系统 中 。/dev/log 被 syslogd 
服务 器 所 使 用 。 想 要 记录 日 志 的 程序 只 要 给 地 址 为 /dev/log 的 socket 发 送 数 据 报 就 行 了 。 
地 址 /dev/printer 被 一 些 打印 系统 使 用 。 


13.9.2 使 用 Unix 域 socket 编程 


为 了 学 习 Unix 域 socket 的 客户 /服务 器 编程 ,这 里 编写 了 一 个 日 志 系统 。 文 件 wtmp 
就 是 日 志 系 统 的 一 个 实例 。 文 件 wimp 记录 系统 的 所 有 登录 、 退 出 以 及 连接 。 日 志 系 统 被 保 
证 安全 和 系统 维护 的 程序 所 使 用 ,用 来 记录 一 些 可 疑 行为 。 日 志 服 务 器 是 一 个 抄写 员 ; 客户 
发 送信 息 给 服务 器 ,服务 器 将 这 些 信息 保存 到 只 有 自己 可 以 修改 的 文件 中 。 日 志 服 务 器 可 
以 用 任何 格式 保存 该 文件 ,客户 并 不 知道 这 些 细节 。 

这 里 的 日 志 服 务 铝 使 用 Unix 域 socket 地 址 。 只 有 同一 台 主 机 上 的 客户 才能 发 消息 给 
它 。 下 面 是 客户 和 服务 器 的 代码 。 服 务 器 先 创建 socket ,然后 绑 定 地 址 : 





[XXX X KKK HK HHH KKK KKK KKK XXX XXX XXX XXX X XO XX X X E X X X XXXXXXx€EXxE 
* logfiled.c - a simple logfile server using Unix Domain Datagram Sockets 

x usage; logfiled 7» logfilename | 

x/ 


i include  «stdio.h 

# include «<sys/types.h> 
# include  «sys/socket. h> 
# include < sys/wn. h> 

# include < time. h> 


+ define MSGLEN 512 
# define oops(m,x) { perror(m); exit(x); } 


+ define SOCKNAME "/tmp/logfilesock" 


int main(int ac, char x av[]) 


{ 


一 一 一 ”一 一 一 一 一 -二 一 一 一 一 一 一 -一 一 -一 -一 -一 一 
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int Sock; /* read messages here x/ 
struct Sockaddr un addr;  . /x this is its address x/ 
Socklen t addrlen; 

char msg| MSGLEN | - 

int | l; 

char Sockname( | = SOCKNAME ; 

time t now; 

int msgnum = O; 

char * timestr; 


/* build an address x/ 
addr.sun family - AF UNIX; /* note AF UNIX «/ 
strcpy(addr.sun path, sockname); /* filename is address x/ 


addrlen = strlen(sockname) + sizeof(addr.sun family); 
Sock = socket(PF UNIX, SOCK DGRAM, 0); /* note PF UNIX x/ 
if ( sock == -1) 

oops("socket",2); 


/* bind the address x/ 
if ( bind(sock, (struct sockaddr x ) &addr, addrlen) == -1) 


oops( "bind", 3); 


/* read and write x/ 


while 1) 

{ 
l = read(sock, msg, MSGLEN); /* read works for DGRAM x/ 
msg(1] = 'XO'; /x make it a string «/ 


time(&now); 
timestr - ctime(&now); 


timestr[strlen(timestr) -1] = '\0'; /* chop newline x/ 


printf("[ $ 5d] & s % s\n", msgnum ^ * , timestr, msg); 
fflush(stdout); 


这 里 仍 使 用 socket 和 bind 来 创建 服务 器 socket, socket 的 类 型 是 SOCK DGRAM, 地 
址 族 是 PF UNIX? socket 地 址 是 文件 名 。 使 用 read 而 不 是 recvfrom, 因 为 不 需要 应 答 ， 
下 面 是 客户 端 程序 : 


[RRR RK KKK RK KK KK KX KKK MK KER KKK NK KKK EX KKK KK KKK KKK KKK KR K K K K X X X 
x logfilec.c - logfile client - send messages to the logfile server 


* usage; logfilec "a message here" 


Q PF LOCAL 也 许 能 替代 PF UNIX, 
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*/ 


# include <«<stdio. h> 

# include <sys/types.h> 
# include <csys/socket. h> 
# include <Csys/un. h> 


# define SOCKET "/tmp/logfilesock" 


i define oops(m,x) { perror(m); exit(x); } 


main(int ac, char x av| |) 
{ 
int sock ; 


struct sockaddr_un addr; 


Socklen t addrlen;. 
char Sockname| | = SOCKET . 
char x msg = av[1]; 


if (ac != 2)( 
fprintf(stderr,"usage; logfilec 'message'\n") ; 
exit(1); 

} 

sock = socket(PF UNIX, SOCK DGRAM, 0); 

if ( sock == -1) 


oops("socket",2); 


addr.sun family = AF UNIX; 
strcpy(addr. sun path, sockname) ; 


addrlen = strlen(sockname) + sizeof(addr.sun family) : 


if ( sendto(sock,msg, strlen(msg), 0, &addr, addrlen) == -1 ) 


oops("sendto",3); 


这 里 使 用 socket 函数 来 创建 socket ,并且 使 用 sendto 发 送 消 息 。 服 务 器 接收 消息 ,然后 
打印 消息 。 消 息 前 面 是 消息 编号 和 时 间 。 
下 面 是 测试 的 情形 : 


$ cc logfiled.c - o logfiled 

$ ./logfiled ——visitorloc& 

1500 | 

$ cc logfilec.c - o logfilec 

$ ./logfilec 'Nice system. Swell software! ' 

$ ./logfilec "Testing this log thing. " 

$ ./logfilec "Can you read this?" 

$ cat vistorlog 

| 0] Mon Aug 20 18,25,34 2001 Nice system. Swell software! 
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[ 1] Mon Aug 20 18:25:44 2001 Testing this log thing. 
[ 2] Mon Aug 20 18;25;48 2001 Can you read this? 


上 述 两 个 程序 展示 了 如 何 使 用 Unix 域 socket 以 及 日 志 服 务 器 的 基本 思想 。 程 序 的 另 
一 个 特征 是 实现 了 自动 追加 功能 ,但 没有 使 用 O_APPEND。 服 务 器 接收 消息 ,然后 把 消息 
追加 到 文件 末尾 。 即 使 有 多 个 客户 同时 发 送 消息 ,底层 的 socket 机 制 会 负责 消息 的 序列 化 。 


13.10 小结 : socket 和 服务 器 


socket 对 于 进程 间 的 数据 通信 和 是 强大 的 .万 能 的 工具 。 这 里 学 习 了 两 种 socket 和 两 种 
socket 地 址 。 | 








域 . 
socket |. — PF INET PF UNIX 
SOCK STREAM 连接 的 , 跨 机 器 连接 的 ,本 地 
SOCK DGRAM 数据 报 , 跨 机 器 数据 报 , 本 地 


在 前 面 的 几 章 中 ,已 经 学 习 了 使 用 这 4 种 组 合 中 的 3 种 socket 的 项 目 。 当 考虑 Unix 的 
”网 络 编程 和 准备 设计 自己 的 项 目 时 ,可 以 考虑 使 用 这 张 表格 中 的 技术 。 根 据 发 送 消息 的 类 
型 以 及 消息 发 送 的 距离 来 选择 最 佳 的 技术 。 


小 BK 


1. 主要 内 容 

。 数据 报 是 从 一 个 socket 发 送 到 另 一 个 socket MRI. WHER socket 是 不 连接 的 ， 
每 个 消息 包含 有 目的 地 址 。 数 据 报 (UDP)socket 更 加 简单 .快速 ,给 系统 增加 的 负荷 
更 小 。 

许可 证 服务 器 是 用 来 对 被 许可 程序 实施 许可 证 验证 规则 的 。 许 可 证 服务 器 发 布 许 
可 ,以 短 消息 的 形式 发 送 给 客户 。 

许可 证 服务 器 必须 记 住 哪个 进程 使 用 了 哪 张 票据 ,必须 维持 一 个 内 部 的 数据 库 。 因 
此 ,许可 证 服务 器 不 同 于 本 书 的 Web 服务 器 。 

记录 系统 状态 的 服务 器 必须 设计 成 可 以 处 理 服务 器 和 客户 端的 崩溃 事件 。 

有 些许 可 证 服务 器 为 一 个 网 络 上 的 多 个 机 器 提供 服务 。 有 了 几 种 设计 方法 ,各 有 优 
缺点 。 

。 socket 可 以 有 两 种 类 型 的 地 址 : 网 络 或 本 地 。 本 地 的 socket 地 址 叫做 Unix 域 
socket 或 名 字 socket。 这 种 socket 使 用 文件 名 作为 地 址 ,只 能 在 一 台 机 器 上 交互 
数据 。 

2. 下 一 步 的 工作 

本 章 学 习 了 两 种 服务 器 处 理 多 个 请 求 的 方法 。 许 可 证 服务 器 接收 数据 报请 求 , 并 且 一 

次 一 条 地 返回 消息 。Web 服务 器 接收 数据 流 消息 ,并 且 使 用 fork 同时 应 答 所 有 请 求 。 服 务 
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器 有 男 外 的 选择 : 一 个 单一 进程 可 以 使 用 线程 的 技术 同时 运行 几 个 函数 。 下 一 章 将 学 习 有 


关 线 程 的 思 


想 和 技术 。 


3. 习题 


13.1 


13.2 


13. 4 


13.5 


13.6 


13. 7 


13.8 


13.9 


在 使 用 流 socket 的 例子 中 ,服务 器 给 客户 应 应 答 时 ， 并 没有 使 用 客户 端的 地 址 ， 服 
务 器 是 如 何 知 道 给 哪个 地 址 的 客户 发 消息 的 ? 


进程 25915 是 如 何 战胜 进程 25914 得 到 票据 的 ? 考虑 每 个 客户 进程 的 创建 和 服 
务 谷 端 请 求 到 达 的 操作 序列 。 在 多 任务 系统 中 ,进程 依次 运行 。 进 程 在 哪儿 可 
以 被 中 断 从 而 得 到 测试 的 结果 ? 


如 何 使 用 一 个 许可 证 服务 器 处 理 2 个 或 更 多 的 程序 的 请 求 ? 一 种 方法 是 修改 协 
以 使 得 每 个 请 求 包含 所 要 运行 的 程序 名 。 描 述 可 以 支持 多 程序 协议 的 数据 结构 
和 程序 逻辑 。 


当 服 务 右 正在 处 理 客户 请 求 时 ,如 果 函 数 ticket_reclaim 被 调用 , 是 否 会 对 票据 列 
表 存 在 潜在 的 破坏 ? 考虑 函数 中 每 个 更 改 数组 和 计数 器 的 地 方 。 在 哪 一 点 上 数 


组 的 状态 和 计数 器 的 值 不 一 致 ? 处 理 函 数 是 如 何 修改 数组 和 计数 器 的 ? 这 些 值 


的 一 个 未 预测 的 改变 对 常规 处 理 函 数 有 何 影响 ? 


当 进 程 被 创建 时 ,进程 ID 被 分 配给 进程 。 考 虑 下 面 的 时 间 序 列 ; 一 个 进程 ID 为 
777 的 客户 得 到 票据 后 前 省 了 。 不 久 ,一 个 不 同 的 用 户 运 行程 序 创建 了 一 个 新 的 
进程 ,进程 ID 恰好 也 是 777。 当 ticket_reclaim 程序 运行 时 , 它 发 现 了 进程 777。 
即使 现在 编号 为 ?77 的 进程 是 一 个 不 相关 的 程序 ,并 且 不 持 有 票据 ,分 配给 原来 
进程 777 的 票据 也 不 能 被 回收 。 当 这 种 情形 出 现时 ,该 如 何 处 理 ? 如 何 避 免 这 类 
事件 的 发 生 。 


一 种 防止 票据 数组 丢失 的 方法 是 服务 器 将 数据 写 到 磁盘 文件 中 。 如 采 要 适应 这 
种 备份 机 制 ,该 如 何 改变 服务 器 ? 假设 客户 会 故意 杀 死 服务 器 以 得 到 更 多 的 票 
据 , 那 么 这 里 的 文件 备份 机 制 在 此 种 情形 下 该 如 何 工作 ? 


持 有 早期 版 本 票据 的 客户 在 等 待 了 较 长 的 时 间 后 来 验证 票据 ,可 能 发 现 已 经 没 
有 更 多 的 可 用 票据 了 。 为 这 种 情形 设计 一 种 应 答 ,使 得 客户 不 允许 继续 运行 , 因 
为 这 将 破坏 最 大 同时 运行 进程 的 数目 ,但 要 求 客户 不 能 突然 退出 。 


参照 本 章 中 列 出 的 问题 ,比较 三 种 分 布 式 许可 证 服务 器 模型 。 


使 用 socket 时 ,可 以 用 write 和 sendto 来 发 送 数据 。 阅读 send 和 sendmsg 的 帮 
助手 册 , 后 面 两 个 函数 与 前 面 的 有 什么 区 吻 ? : 


13.10 轿车 管理 系统 与 数据 报 不 只 是 比喻 。 设 想 每 部 轿车 都 装 有 GPS 设备 。 一 个 计 


算 机 可 以 通过 modem 连接 到 Internet, 使 得 可 以 定位 轿车 的 位 置 。 设 想 轿车 的 
局 动 不 是 受 钥匙 控制 ,而 是 通过 一 个 磁卡 的 登录 来 控制 。 设计 一 个 介 许 雇员 有 登 
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录 到 系统 来 使 用 轿车 ,并 且 管 理 员 可 以 跟踪 司机 行驶 路 线 以 及 定位 轿车 位 置 的 


编程 练习 
11 更 改 程序 dgrecv. c, 要 求 不 仅 打印 出 发 送 者 的 地 址 和 消息 接收 的 时 间 ,还 要 打印 
消息 编号。 消息 标号 从 0 开始。 希望 得 到 的 输出 如 下 : 
dgrecv:got a message ; testing 123 
from. 10.200.75.200.1041 
at :Sun Aug 19 10,22,27 EDT 2001 
msg # ;23 


12 为 dgsend.c 增 加 客户 程序 dgrecv2. c, 


3 许可 证 服务 器 在 一 张 表 中 存 有 客户 拥有 票据 的 信息 。 如 果 想 要 服务 器 打印 这 
些 信息 ,该 如 何 操作 ? 看 到 表 的 信息 有 助 于 排 错 或 测试 服务 器 。 一 种 标准 的 和 
服务 器 通信 技术 是 使 用 信号 。 

更 改 程序 lservl 使 得 它 在 接收 信号 SIGHUP 时 ,打印 出 表 的 内 容 。 可 以 通过 命 
^ kill — HUP serverpid 来 测试 该 特征 。 


— 


B 


4 更 改 许 可 证 服务 器 使 得 它 只 在 一 个 客户 的 请 求 被 拒绝 时 , 才 调 用 ticket. reclaim 
程序 。 该 方法 的 优 缺 点 各 是 什么 ? 


15 更 改 lclnt2. c 程序 ,使 它 睡眠 5 秒 钟 后 验证 票据 。 如 果 票 据 合法 ,客户 再 睡眠 5 
秒 钟 ,然后 退出 并 归还 票据 。 如 果 票 据 不 合法 ,客户 尝试 请 求 另 一 个 票据 。 如 果 
成 功 , 继 续 正常 操作 。 如 果 失 败 ,告诉 用 户 许可 证 服务 器 出 错 然后 再 退出 。 


16 更改 前 面 章节 中 编写 的 shell 程序 和 bounce 程序 ,使 用 许可 证 服务 器 。 在 哪 增 
加 票据 验证 过 程 y 当 服务 器 崩溃 时 ,票据 不 可 用 了 ,该 和 用 户 说 什么 ? 


更 改 客 户 服务 器 代码 使 得 票据 包含 有 主机 IP 地 址 。 如 何 改变 票据 列表 ? 确信 
对 验证 函数 也 做 了 改变 。 


18 实现 三 种 分 布 式 许可 证 控制 模型 的 一 种 。 


TJ 
—] 


19 日 志 系 统 的 一 个 问题 是 其 中 的 消息 都 是 匿名 的 ,更 改 该 系统 使 得 消息 包含 发 送 
消息 用 户 的 用 户 名 。 


20 在 日 志 服 务 器 中 使 用 read。 编 写 两 个 新 版 本 的 服务 器 ,一 个 使 用 recvfrom, 5 
一 个 使 用 recv。 这 些 获 取 数 据 的 方法 有 何不 同 ? 更 详细 的 信息 请 阅读 帮助 
手册 。 


21 如 果 许 可 证 服务 器 和 客户 需要 使 用 Unix 域 socket ,需要 做 何 改 变 ? 解释 客户 为 
什么 要 使 用 bind, | 
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在 第 1 章 中 ,讨论 了 一 个 Internet 桥牌 游戏 。 在 任何 的 分 布 式 扑克 游戏 中 ,软件 
必须 模拟 一 个 扑克 牌 栈 , 以 确保 两 个 客户 不 会 持 有 相同 的 扑克 。 

编写 一 对 程序 cardd 和 cardc, 使 用 数据 报 来 处 理 一 桌 的 扑克 牌 。 启 动 时 服务 先 
洗 牌 , 接 下 来 客户 从 命令 行 启动 ,就 可 以 从 服务 器 获取 扑克 牌 。 例 程 运行 如 下 : — 
$ cardc get 5 

4D AH 2D TD KC 


结果 显示 客户 得 到 了 5 张 牌 ,一 张 方块 4, 一 张 红 桃 A ,一 张 方块 2 ,一 张 方块 10， 
一 张 王 。 确 保 程序 不 会 将 相同 的 扑克 牌 发 给 两 个 用 户 机 ,并 且 协 议 要 有 途径 表 
BH dealer 何 时 发 完 牌 。 考 虑 一 下 还 有 其 他 什么 有 用 的 事务 可 以 作为 协议 的 
补充 ? 


基于 本 章 的 内 容 , 可 以 学 习 编 写 下 面 的 Unix 程序 : 
talk,rwho, jf i pk ARS BS 














概念 与 技巧 

。 程序 的 执行 路 线 

。 多 线程 程序 

。 创建 及 销毁 线程 

。 使 用 互 斥 锁 机 制 保证 线程 间 数 据 的 安全 共享 
。 使 用 条 件 变量 同步 线程 间 的 数据 传输 

。 传递 多 个 参数 给 线程 

相关 的 系统 调用 与 函数 

* pthread create, pthread join 

* pthread mutex lock, pthread mutex unlock 


e pthread cond wait,pthread cond signal 


14.1 同一 时 刻 完 成 多 项 任务 


不 知 记 你 是 否 经 常会 被 一 些 充满 了 闪烁 .跳动 或 者 旋转 图 片 的 网 页 并 得 很 不 舒服 ,不 过 
我 确实 不 喜欢 它们 。 然 而 尽管 这 些 网 页 让 人 很 烦 ,它们 却 引 发 了 一 个 技术 问题 ; 一 个 程序 如 
何 才 能 在 同一 时 刻 完成 多 个 任务 呢 ? 

动画 图 片 并 不 是 惟一 可 以 完成 并 发 功能 的 Web 程序 。 想 想 看 日 常生 活 中 的 浏览 器 , 它 
可 以 从 不 同 的 服务 器 上 下 载 并 且 解 压缩 图 片 。 浏 览 器 并 行 地 完成 这 么 多 的 任务 ,而 非 一 项 
接 一 项 地 做 ,那么 它 又 是 如 何 同时 下 载 并 解压 这 些 图 片 的 ? 

多 任务 系统 的 问题 在 本 书 中 早已 介绍 过 了 。 视 频 游 戏 那 一 章 , 使 用 计时 器 和 两 个 计数 
锅 在 两 维 空间 中 控制 图 片 的 动作 。 其 他 的 章节 也 曾 用 fork 和 exec 创建 新 进程 的 方法 处 理 
并 发 程序 ,从 而 实现 一 个 Web 服务 器 的 功能 。 那 么 这 里 为 何不 用 这 种 方法 呢 ? 

书 中 曾 使 用 fork 和 exec 同时 运行 多 个 程序 。 如 果 希 望 同 时 运行 几 个 函数 ,或 者 同时 对 
一 个 函数 调用 很 多 次 , 那 该 怎么 办 呢 ? 

本 章 将 介绍 线程 。 线 程 相 对 于 函数 就 类 似 于 进程 相对 于 程序 ,后 者 为 前 者 提供 了 运行 
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环境 。 很 多 肾 数 可 以 同时 运行 ,但 它们 都 在 相同 的 进程 中 。 

本 章 主要 的 项 目 是 完成 一 个 程序 让 文本 框 中 出 现 不 断 移 动 的 文字 。 这 里 将 先 修改 以 前 
的 那个 Web 服务 器 程序 ,让 它 不 启动 新 的 进程 即 可 处 理 访问 目录 列表 以 及 文件 内 容 的 并 发 
请 求 。 


14.2 因数 的 执行 路 线 


什么 是 线程 ? AMA? 又 如 何 去 创 建 它 呢 ? 首先 看 下 面 的 一 个 传统 的 程序 ,在 此 程序 
中 ,指令 一 条 接 一 条 的 顺序 执行 。 然 后 ,只 要 将 此 程序 做 两 个 小 的 改动 , 即 可 让 程序 并 行 的 
Tu Bi RR. 


14.2.1 一 个 单线 程 程序 


/x hello single.c - a single threaded hello world program */ 


# include <¢stdio. h> 
# define NUM 5 


main() 


1 
void print msg(char x); 


print msg(("hello'"); 
print msg(("worldXMn"); 
| 
void print msg(char x m) 
{ 
int i; 
for (1=0 ; i< NUM ; i++ ){ 
printf(("%s", m); 
fflush(stdout); 
sleep(1); 


} 


在 hello single. c H, main 函数 顺序 地 调用 了 两 个 函数 。 每 个 函数 执行 了 一 个 循环 。 
下 面 的 输出 结果 反映 了 程序 的 控制 流 ， 


$ cc hello single.c - o hello single 
$ ./hello single 
helloheliohellohellohelloworild 
world | 

world 

world 


world 
$ 
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上 面 的 每 一 行 输出 之 间 都 有 一 个 1 addidi id 运行 了 10 秒 。 图 14. 1 展示 了 此 
程序 的 执行 流程 。 


执行 路 径 
一 个 进程 
print msg() MTER 
aie t 一 个 线程 





14.1 单 执行 路 径 


| 首先 ,执行 路 径 进 入 main 函数 ,然后 进入 函数 print_msg。 接 着 ,从 print msg 中 返回 到 
main, 之 后 再 一 次 进入 print. msg 函数 进行 第 二 次 的 函数 调用 。 所 有 指令 执行 完毕 后 ,从 
main 中 返回 。 
不 间断 地 跟踪 指令 执行 的 路 径 在 这 里 被 称 做 执行 路 线 (thread of execution), 传统 的 程 
序 只 有 一 条 单独 的 执行 路 线 。 就 算是 包含 有 goto 语句 以 及 递归 子 程序 的 程序 也 只 有 一 条 执 
行路 线 , 尽 管 这 条 路 线 有 时 有 些 弯 弯 绕 绕 。 


14.2.2 一 个 多 线程 程序 


如 果 想 同时 执行 两 个 对 于 print. msg 函数 的 调用 ,就 像 使 用 fork 建立 两 个 新 的 进程 一 
样 , 那 该 怎么 办 呢 ?” 这 种 思想 清楚 地 体现 在 图 14.2 中 。 


原始 线程 


print msg () 





图 14.2 多 执行 路 径 的 程序 


首先 ,一 条 执行 线路 进入 main 函数 。 初 始 的 线路 新 建 了 一 条 新 的 执行 线路 来 运行 函数 
print_msg。 初 始 线路 继续 执行 下 一 条 指令 从 而 新 建 了 另 一 条 线路 来 对 print. msg 函数 进行 
第 二 次 的 调用 。 最 后 ,初始 线路 等 待 两 条 新 的 线路 加 入 自己 ,再 从 main 函数 中 返回 。 

人 们 无 时 无 刻 不 在 进行 着 这 种 多 线程 的 任务 管理 。 如 果 父 母 需要 做 许多 琐事 ,他 们 通 
常会 带 上 孩子 一 起 去 。 父 母 让 一 个 孩子 到 杂货 铺 买 牛奶 , 另 一 个 孩子 去 图 书馆 还 书 ; 最 后 
等 两 个 孩子 都 回来 之 后 ,大 家 再 一 起 回 家 。 

一 个 线程 就 类 似 于 上 例 中 帮 父 母 做 事情 的 一 个 孩子 。 如 果 想 同时 完成 许多 事情 ,最 好 
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多 带 几 个 孩子 一 起 去 。 类 似 地 , 如果 一 个 程序 希望 同时 执行 很 多 哺 数 , 它 必须 创建 多 个 线 
程 。 下 面 的 这 个 程序 hello multi. c 将 图 14. 2 的 思想 实现 了 。 


/x hello multi.c - a multi- threaded hello world program */ 


# include <stdio.h> 
# include <(pthread. h> 


+ define NUM 5 
maint ) 


| 
pthread t ti, t2; /* two threads x/ 


void x print msg(void x); 


pthread create(&tl, NULL, print msg, (void x )"hello"); 
. pthread create(&t2, NULL, print msg, (void x ) "world\n") ; 
pthread join(ti, NULL); 
pthread join(t2, NULL); 
} 
void * print msg(void * m) 
( 
char *cp = (char *) m; 
int i; 
for (i=0 ; i«NUM ; itt ){ 
printf(" $ s", m); 
fflush(stdout); 
Sleep(1); 
j 
return NULL; 
; 


注意 一 下 此 程序 与 原先 那个 程序 的 区 别 。 首 先 ,这 里 包含 了 一 个 头 文件 pthread. h, © 
包含 了 数据 类 型 的 定义 和 函数 的 原型 。 其 次 ,程序 中 定义 了 pthread t 类 型 的 两 个 变量 tl 和 
t2。 这 两 个 线程 就 类 似 于 上 面 所 说 的 父母 办 事 时 所 带 的 两 个 孩子 。 

图 14.2 控制 流 中 的 每 一 个 分 支点 都 对 应 了 如 下 的 一 行 代码 : 


pthread create(&tl,NULL,print msg,(void* )"hello") 


JC 88 CURE FEE LIS FSC REI = EF, 3C hello 来 运行 函数 print. msg." E ifi 48 
一 个 参数 是 线程 的 地 址 ; 第 二 个 参数 是 指向 线程 属性 的 指针 ; 第 三 个 参数 是 所 要 执行 的 函 
数 名 称 ; 而 第 四 个 参数 则 是 指向 所 要 传递 给 函数 的 参数 的 指针 。 

这 条 指令 使 用 指定 的 属性 新 建 了 一 个 线程 ,而 此 线程 使 用 参数 hello 来 运行 函数 


print msg. 
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pthread_create(&t2,NULL, print_msg, (void * ) “world\n") 


此 函数 也 使 用 默认 的 属性 创建 了 一 个 新 的 线程 。 新 的 线程 用 参数 world\n 来 运行 PR BX 
print msg. 

而 函数 pthread joinCt1, NULL); 类 似 于 父母 等 待 孩子 归来 一 样 main 借助 于 此 函数 来 
等 竺 两 个 线程 执行 路 线 的 返回 。 函 数 pthread join 使 用 了 两 个 参数 。 第 一 个 参数 是 所 要 等 
待 的 线程 ,而 第 二 个 参数 则 是 一 个 指向 返回 值 的 指针 。 如 采 此 参数 为 NULL, 表 示 返 回 值 不 
被 考虑 。 

pthread_join(t2, NULL); 表示 main 国 数 等 待 另 一 个 线程 返回 。 

编译 此 程序 ,并 运行 ,输出 结果 如 下 : 


$ cc hello multi.c - lpthread - o hello multi 
$ ./hello multi 

helloworld 

helloworld 

helloworld 

helloworld 

helloworld 

$ 


此 程序 只 运行 了 5 秒 钟 ,因为 两 个 循环 并 行 的 执行 。 不 过 对 于 线程 调度 的 不 同 可 能 会 导 
致 输出 与 上 面 所 示 的 输出 不 同 。 大 家 可 能 已 经 注意 到 ,线程 的 使 用 是 多 人 么 的 灵活 。 在 这 里 
同时 运行 了 同一 个 函数 的 两 个 不 同 实例 ,仅仅 参数 是 不 同 的 。 当 然 同 时 运行 两 个 不 同 的 函 
数 也 是 一 样 的 容易 。 


14.2.3 相关 函数 小 结 





pthread create 











目标 创建 一 个 新 的 线程 

头 文件 # include « pthread. h> 

函数 原型 int pthread_create (pthread t * thread, 
pthread attr t x attr, 
void * ( * func) (void * ) 
void * arg); 

参数 thread 指向 pthread t 类 型 变量 的 指针 


attr 指向 pthread attr it 类 型 变量 的 指针 ,或 者 为 NULL 
func 指向 新 线程 所 运行 函数 的 指针 
arg 传递 给 func 的 参数 





返回 值 0 成 功 返 回 


errcode ”错误 | 
meee 








。428 。 | Unix/Linux 编程 实践 教程 





pthread create 图 数 创建 了 一 条 新 的 执行 线路 ,在 此 新 的 线程 内 调用 了 func(Carg) 。 新 线 
程 的 属性 由 attr 参数 来 指定 。func 是 一 个 函数 , 它 接 收 一 个 指针 作为 它 的 参数 ,并 且 运 行 结 
束 后 返回 一 个 指针 。 参 数 和 返回 值 都 被 定义 为 类 型 为 voidx 的 指针 ,以 允许 它们 指向 任何 类 
型 的 值 。 

如 果 attr (A NULL ,线程 使 用 的 是 默认 的 属性 。 下 一 章 中 将 讨论 线程 的 属性 。 
pthread create 如 果 运 行 成 功 返 回 0, 否 则 返回 一 个 非 零 错误 代码 。 


Pthread join 





目标 等 待 某 线 程 终 目 
头 文 件 # include < pthread. h> 
项 数 原 型 int pthread join(pthread t thread, void * x retval) 
参数 thread ME 的 线程 
retval 指向 某 存 储 线 程 返回 值 的 变 基 
返回 值 0 成 功 返 回 
errcode 错误 


pthread join 使 得 调用 线程 挂 起 直至 由 thread 参数 指定 的 线程 终止 。 如 果 retval 不 是 
null, 线 程 的 返回 值 就 将 存储 在 由 retval 指向 的 变量 中 。 

当 线 程 终止 时 ,pthread_join 函数 返回 0, 如果 有 错误 发 生 , 则 返回 一 个 非 零 错误 代码 。 
如 果 某 线程 试图 等 待 一 个 并 不 存在 的 线程、 多 个 线程 同时 等 待 一 一 个 总 程 返 加 或 者 线程 试图 
等 得 自 己 都 将 导致 函数 返回 一 个 错误 代码 ，。 

使 用 线程 进行 编程 就 像 给 一 些 人 赋予 不 同 的 任务 。 如 果 加 强项 目 管理 ,保证 所 有 的 人 
都 能 够 按 序 办 事 , 不 和 别人 冲突 ,这 个 项 目 肯定 会 提前 完成 。 下 面 将 介绍 可 以 使 线程 分 工 合 
作 的 技术 。 


14.3 ”线程 间 的 分 工 合作 


进程 间 可 以 通过 管 道 ,socket 、 信 和 号 、 退出 /等 待 以 及 运行 环境 来 进行 会 话 。 线程 间 的 通 
信也 很 容易 。 多 个 线程 在 一 个 单独 的 进程 中 运行 ,共享 全 局 变量 ,因此 线程 间 可 以 通过 设置 
和 读 取 这 些 全 局 变量 来 进行 通信 。 不 过 要 知道 ,对 共享 内 存 的 访问 可 是 线程 的 一 个 既 有 用 
义 极 为 危险 的 特性 。 | 


14.3.1 例 1: incrprint.c 
/* incprint.c - one thread increments, the other prints x/ 


i include <stdio. h> 
# include <pthread. h> 


# define NUM 5 
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int counter = 0; 
main() 
( 
pthread t t1; /* one thread x/ 
void * print count(void x); /x its function x/ 
int i; 


pthread create(&tl, NULL, print count, NULL); 
for(i = 0; i-NUM ; i++ )( 

counter ++ ; 

sleep(1); 
j 


pthread, join(tl, NULL); 
} 
void * print count(void x m) 
{ 
int i; | 
for (i=0 ; i<NUM ; i++){ 
printf("count = % d\n" , counter); 
sleep(1); 
} 
return NULL; 
j 


程序 incprint. c 使 用 了 两 个 线程 。 初始 线程 执行 了 一 个 循环 来 使 计数 器 值 每 秒 钟 增 1, 
包 始 线程 在 进入 循环 之 前 ,创建 了 一 个 新 的 线程 新 的 线程 运行 了 一 个 函数 来 将 counter 的 
值 打印 出 来 。main 函数 和 print count 函数 运行 在 同一 个 进程 中 ,所 以 都 有 对 于 counter 的 
访问 权 。 图 14. 3 展示 了 两 个 函数 和 全 局 变量 的 内 在 逻辑 





图 14. 3 ”两 个 线程 共享 全 局 变量 


34 main 函数 改变 了 counter 值 之 后 ,print_counter 销 数 立即 可 以 访问 到 新 的 值 。 因此 
并 不 需要 通过 管道 或 者 套 接 字 等 方法 传送 新 的 值 。 编译 这 个 程序 ,然后 运行 它 ,结果 如 下 ， 


$ cc incprint.c - lpthread - o incprint 
$ ./incprint 
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count 
count 
count 


count 


I I ll I 
Ui A U N e 


count = 


程序 显然 可 以 正常 工作 。 一 个 函数 修改 了 变量 , 另 一 个 函数 读 取 并 显示 了 变量 的 值 。 
这 个 例子 展示 了 如 何 使 运行 在 不 同 线程 中 的 函数 共享 全 局 变量 。: 不 过 下 个 例子 还 要 有 趣 。 


14.3.2 例 2: twordcount. c 


很 多 学 生 都 有 这 样 的 经 验 , 对 着 电脑 数 自 己 学 期 论文 的 字数 以 确定 字数 是 不 是 足够 
假设 一 个 学 生 有 一 篇 10 页 纸 的 论文 , 它 有 两 种 方法 来 计算 这 篇 文章 的 字数 。 一 种 是 一 个 字 
一 个 字 地 数 了 10 页 纸 , 另 一 种 方法 是 找 10 个 同学 来 ,给 每 个 同学 二 页 纸 * 证 他 们 分 别 计算 ， 
然后 将 结果 累加 起 来 。 显 然 并 行 地 计算 这 10 页 纸 的 字数 的 方法 会 快 很 多 。 

Unix 平台 上 的 wc 程序 的 作用 是 计算 一 个 或 多 个 文件 中 的 行 .单词 以 及 字符 个 数 。 不 
过 wc 是 一 个 典型 的 单线 程 程序 。 怎 样 来 设计 一 个 多 线程 程序 来 计数 并 打印 两 个 文件 中 的 
所 有 字数 呢 ? | 

。 版 本 1: 两 个 线程 一 个 计数 器 

第 一 个 版 本 程序 创建 分 开 的 线程 来 对 每 一 个 文件 进行 计算 。 所 有 的 线程 在 检查 到 单词 
的 时 候 对 同一 个 计数 器 增值 。 图 14. 4 体现 了 这 个 思路 。 | 





图 14.4 两 个 线程 共享 一 个 通用 计数 器 
此 版 本 的 代码 包含 在 文件 twordcountl. c 中 : 


/* twordcountl.c — threaded word counter for two files. Version 1 x/ 


# include <stdio. h> 
# include < pthread. h> 
# include < ctype. h> 


int total words ; 


main(int ac, char x av[ ]) 
{ 
pthread_t t1, t2; /* two threads x/ 
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void  *count words(void x); 


if (ac != 3 ){ 
printf("usage: % s filel file2\n", av[0 D; 
exit(1). 
j 
total words - 0; 
pthread create(&tl, NULL, count words, (void x av[1]; 
pthread create(&t2, NULL, count words, (void * ) av[2]); 
pthread join(tl, NULL); | 
pthread join(t2, NULL); 
printf(" $ 5d; total words\n", total words); 
j 
void x count words(void x f) 


{ 


char x filename = (char x) f; 
FILE * fp; 
int c, preve = '\0'; 


if ( (fp = fopen(filename, "r")) t= NULL ){ 
while( ( c = getc(fp))!= EOF ){ 
if ( ! isalnum(c) && isalnum(prevc) ) 
total words ++ ; | 
prevc = c; 
} 
fclose(fp); 
} else 
perror(filename); 
return NULL; 
j 


PRA count words 是 这 样 区 分 单词 的 : 凡是 一 个 非 字母 或 数字 的 字符 跟 在 字母 或 数字 
的 后 面 ,那么 这 个 字母 或 数字 就 是 单词 的 结尾 。 当 然 这 种 思路 忽略 了 文件 的 最 后 一 个 单词 ， 
并 且 还 把 U. S. A ”看 成 三 个 独立 的 单词 。 编 译 此 程序 并 按照 如 下 的 方法 进行 测试 ; 


$ cc twordcountl.c - lpthread - o twcl 
S ./twcl /etc/group /user/dict/words 
45614; total words 
$ wc -w /etc/group /usr/dict/words 
58 /etc/group 
45402 /user/dict/words 
45460 total 


twordcountl 产生 的 结果 与 wc 并 不 相同 ,因为 两 个 程序 对 于 单词 结尾 规则 的 定义 不 同 。 
这 里 还 有 一 个 比 单词 结尾 更 加 微妙 的 问题 : 所 有 线程 对 同一 个 计数 器 进行 操作 ,并且 在 
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同时 进行 。 细 心 的 读者 也 许 会 问 : 这 样 会 不 会 有 问题 啊 ? C 语言 并 没有 指定 操作 total. 
words 十 + 是 如 何 被 计算 机 执行 的 。 计 算 机 有 可 能 执行 的 是 这 样 一 个 操作 : 


total words = total words + 1 


tL A V ERE ORE HT ae 2 BUS EUER AST TES HP 1 操作 后 ,再 将 其 恢复 到 内 存 中 。 

那么 如 果 所 有 线程 在 同一 时 刻 都 使 用 “取出 一 加 一 存储 ”的 序列 来 完成 对 计数 器 的 操 
作 , 结 果 会 如 何 呢 ? 

图 14.5 所 示 的 是 所 有 线程 取出 同样 的 值 ,对 寄存 能 增 1 ,然后 再 恢复 新 的 值 。 两 次 增 1 
操作 同时 发 生 , 但 是 计数 器 的 值 只 能 一 次 一 次 的 增加 。 如 何 来 保证 线程 间 不 会 互相 干扰 对 
方 工作 呢 ? 下 面 将 采用 两 种 办 法 进行 尝试 。 | 


time 
. Thread 1 Thread 2 


. total words get value from variabie 
a get value from variable 







= add 1 to value 
. acd 1 to value 15: 


101 


3 store in variable store ir variable 
Y 
图 14.5 两 个 线程 对 同一 个 计数 器 进行 操作 
© 版 本 Zi: 两 个 线程 .一 个 计数 器 .一 个 互 斥 量 
大 家 注意 到 在 机 场 或 者 公交 车 终点 站 的 公共 存储 柜 始终 是 打开 的 ,除非 有 人 在 里 面 
存 了 东西 。 当 一 个 人 扔 了 硬币 然后 拿 到 了 钥匙 之 后 , 便 没有 别人 可 以 再 去 打开 那个 柜子 
本。 只 有 等 到 这 个 人 归还 了 钥匙 ,把 柜子 打开 之 后 ,其 他 人 才 可 以 再 去 使 用 。 类 似 地 ,如 
来 两 个 线程 需要 安全 地 共享 一 个 公共 的 计数 器 ,它们 也 需要 这 样 一 种 方法 把 变量 加 锁 。 
线程 系统 包含 了 称 为 互 斥 锁 的 变量 , 它 可 以 使 线程 间 很 好 的 合作 ,避免 对 于 变量 、 函 数 
以 及 资源 的 访问 冲突 。 下 面 的 程序 twordcount2. c 将 告诉 大 家 如 何 创 建 和 使 用 互 斥 量 : 


/x twordcount2.c — threaded word counter for two files. x/ 
/* version 2, uses mutex to lock counter x/ 

# include <stdio. h> 

# include <(pthread. h> 

i include «ctype. h> 


int total words ; /x the counter and its lock x/ 


pthread mutex t counter lock - PTHREAD MUTEX INITIALIZER; 


main(int ac, char x av| |) 


{ 
pthread t tl, t2; /* two threads x/ 


void * count words(void x); 


if (acl= 3 ){ 
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printf("usage: % s filel file2\n", avit [0]; 
exit(1); 
} 
total words =[0]; 
pthread_create(&t1, NULL, count words, (void x ) av[1]); 
pthread create(&t2, NULL, count words, (void * ) av[2]); 
pthread join(tl, NULL); 
pthread join(t2, NULL); 
printf(" $ 5d; total words\n", total words); 
} 
void x count words(void * f) 
{ 
char x filename = (char *)f; 
FILE x fp; 


int c, prevc = '\0'; 


if ( (fp = fopen(filename, "r"))!= NULL ){ 
while( ( c = getc(fp))!= EOF ){ 
if ( | isalnum(c) && isalnum(prevc) ) { 
pthread_mutex_lock(&counter_ lock); 
total words ++ ; 
pthread mutex unlock(&counter lock); 
j 
prevc = c; 
} 
fclose(fp) ; 
} else 
perror(filename) ; 
return NULL; 
j 


此 程序 的 逻辑 类 似 于 图 14. 6 所 示 。 
一 个 进程 细心 的 读者 可 以 发 现 , 在 原来 的 程序 中 仅仅 加 
— 一 个 计数 器 了 三 行 代码 。 首 先 定 义 了 一 个 pthread_mutex_t 类 
= 型 的 全 局 变量 counter lock, 然后 赋 给 它 一 个 初 值 。 
另外 改动 的 地 方 就 是 把 对 于 count. words 的 操作 夹 
在 对 两 个 函数 pthread mutex_lock 以 及 pthread _ 
mutex unlock 的 调用 之 间 。 
现在 两 个 线程 可 以 安全 地 共享 计数 器 了 。 当 一 
个 线程 调用 pthread mutex lock 的 时 候 , 如 果 另 一 
图 14.6 两 个 线程 使 用 互 斥 锁 来 。 个 线 程 已 经 将 这 个 互 斥 量 锁 住 了 , 那 这 个 线程 只 好 阻 
i 塞 等 待 着 这 个 锁 被 另 一 个 线程 解 开 后 , 才 可 以 对 计数 





E 两 个 线程 
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名 进行 操作 。 每 个 线程 对 计数 右 进 行 操作 后 ,都 将 互 斥 量 解 锁 , 然 后 循环 地 处 理 其 他 数据 。 
任何 数目 的 线程 都 可 以 挂 起 等 待 互 矿 量 解锁 。 当 一 个 线程 对 互 斥 量 解锁 之 后 ,系统 就 

将 控制 权 交 给 等 候 的 某 一 线程 。 如 所 有 线程 都 按照 这 种 互 斥 原则 进行 通信 时 , 互 斥 量 是 有 

用 的 ; 然而 如 果 一 个 线程 不 遵守 这 个 规则 ,直接 去 修改 计数 器 的 值 的 话 ,程序 员 也 无 能 为 力 。 








pthread mutex lock 








目标 等 待 互 斤 锁 解 开 然后 再 锁 住 互 斥 量 
头 文件 # include << pthread. h> 
函数 原型 int pthread_mutex_lock(pthread_mutex_t x mutex ) 
参数 mutex 指向 互 夺 锁 对 象 的 指针 
返回 值 0 成 功 返 回 
errcode 错误 





pthread mutex lock 函数 用 来 锁 住 指定 的 互 斥 量 。 如 果 互 斥 量 是 开放 的 , 它 被 锁 住 ;并 
只 能 由 调用 线程 来 管理 。 如 果 此 时 互 斥 量 已 经 被 另外 的 线程 锁 住 ,调用 线程 将 挂 起 等 待 此 
互 斥 量 被 解锁 。 如 果 调 用 过 程 中 出 现 错误 ,函数 将 返回 一 个 错误 代码 。 





pthread mutex unlock 








目标 给 互 斥 量 解锁 

头 文件 # include < pthread. h> 

函数 原型 int pthread_mutex_unlock(pthread_mutex_t* mutex) 
参数 mutex 指向 互 斥 锁 对 象 的 指针 

返回 值 0 成 功 返回 


errcode 错误 





pthread mutex unlock 函数 给 指定 的 互 斥 量 解锁 。 如 果 有 线程 挂 起 等 待 此 互 斥 量 ,其 
中 的 一 个 线程 将 获得 对 互 斥 锁 的 控制 权 。 若 解锁 成 功 , 此 函数 将 返回 0, 否则 返回 一 个 非 零 
的 错误 代码 。 

不 过 上 面 讨论 的 都 是 正常 的 情况 。 如 果 一 个 线程 试图 解锁 一 个 并 没有 被 锁 住 的 互 斥 量 
Ake GAR? 如 果 线 程 企图 对 一 个 已 经 锁 住 的 互 斥 量 加 锁 呢 ?又 如 果 一 个 线程 还 没有 对 自 
己 锁 住 的 互 斥 量 解 锁 就 退出 了 ,那么 结果 又 会 如 何 呢 ? 不 同 的 线程 系统 对 于 这 些 问 题 的 处 
理 方 法 各 不 相同 。 详 情 请 参见 你 所 使 用 的 Unix 的 参考 手册 。 

是 否 需 要 互 斥 量 ? 如 果 多 个 线程 企图 在 同一 时 刻 修改 相同 的 变量 ,它们 只 好 使 用 互 斥 量 
来 避免 访问 冲突 。 然 而 使 用 互 斥 量 使 得 程序 运行 速度 变 慢 。 对 所 有 文件 中 的 每 一 个 单词 都 
需要 执行 检查 ,设置 以 及 释放 锁 的 操作 ,这 使 得 程序 效率 低下 。 更 加 有 效 的 方法 是 为 每 个 线 
程 设置 自己 的 计数 器 。 

。 版 本 3: 两 个 线程 .两 个 计数 器 、 向 线程 传递 多 个 参数 

下 一 个 版 本 的 字数 统计 程序 为 每 个 线程 设置 了 自己 的 计数 器 ,从 而 避免 了 对 于 互 斥 量 
的 使 用 。 当 线程 返回 之 后 ,再 将 这 两 个 计数 器 的 值 加 起 来 得 到 最 后 的 结果 ， 
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如 何 来 得 到 这 些 线程 的 计数 器 ? 又 如 何 使 线程 将 它们 的 计数 值 返回 呢 ? 在 一 个 通常 的 
单线 程 程序 中 ,字数 统计 函数 将 得 出 的 字数 返回 给 它 的 调用 郴 数 。 线 程 可 以 通过 调用 
pthread exit 得 到 返回 值 ,这 个 返回 值 义 可 以 通过 pthread_join 的 调用 被 原先 的 线程 得 到 。 
详情 可 以 参见 手册 。 下 面 将 使 用 一 个 稍微 简单 一 点 的 方法 。 

调用 线程 通过 传递 给 函数 一 个 指向 某 变 量 的 指针 ,让 函数 对 此 变量 进行 操作 ,从 而 可 以 
避免 让 线程 将 值 传 回 。 传 递 指针 引发 了 一 个 问题 : PRK pthread create 只 能 允许 传递 一 个 
参数 给 郴 数 ,而 文件 名 又 必须 传 给 函数 ,那么 如 何 传 这 个 指针 呢 ? 办 法 很 简单 ,只 需 建 一 个 
包含 两 个 成 员 的 结构 体 , 然 后 将 此 结构 体 的 地 址 传 给 函数 即 可 。 


/x twordcount3.c - threaded word counter for two files. 


x — Version 3, one counter per file 


*/ 


# include <stdio. h> 
# include <(pthread. h> 
if include <(ctype. h> 


struct arg set | /* two values in one arg «/ 
char * fname; /x file to examine — x/ 
int count; /x number of words x/ 


b; 
main(int ac, char x* av[ D 


| 


pthread t ti, t2; /* two threads */ 
struct arg set argsl, args2; /* two argsets x/ 
void * count words(void x); 


if ( ac!» 3)í( 
printf("usage; %s filel file2\n", avit k[0]; 
exit(1); 

j 

argsl.fname = av|1]; 

argsl.count = 0; 


f 


pthread create(&tl, NULL, count words, (void * ) &args1); 


args2.fname = av[2]; 
args2.count = 0; 


f 


pthread create(&t2, NULL, count words, (void * ) &args2); 


Fr 


pthread join(tl, NULL); 

pthread join(t2, NULL); 

printf(" $ 5d; % s\n", argsl.count, av[1]); 

printf("% 5d. $ sin", args2.count, av[2]); 

printf("% 5d; total words\n", argsl.count + args2. count) ; 


} 


void x count words(void * a) 
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struct arg set x args = a; /* cast arg back to correct type x/ 
FILE x fp; 
int c, prevc = '\0'; 


if ( (fp = fopen(args - >fname, "r"))!- NULL ){ 
while( ( c = getc(fp))!= EOF ){ 
if ( | isalnum(c) && isalnum(prevc) ) 
args — — count ++ 
prevc = c; 
} 
fclose(fp) ; 
} else 
perror(args - >fname) ; 
return NULL; 
j 


这 里 通过 定义 一 个 以 文件 名 和 该 文件 中 字数 为 成 员 的 结构 体 解决 了 同时 传递 两 个 参数 
的 问题 。main 函数 定义 了 两 个 这 种 类 型 的 局 部 变量 ,并 将 这 两 个 变量 的 地 址 传 给 线程 (如 图 
14.7 所 示 )。 传 递 本 地 结构 体 指针 的 方法 既 避 免 了 对 互 斥 量 的 依赖 ,又 消除 了 全 局 变量 。 


一 个 进程 


注意 : 这 里 并 没有 锁 





图 14.7 每 个 线程 都 拥有 一 个 指向 自己 结构 体 的 指针 


每 次 调用 函数 count_words 之 后 都 会 接收 到 一 个 指向 不 同 结构 体 的 指针 ， 因此 线程 从 不 
同 的 文件 中 读 取信 息 ,并 对 不 同 的 计数 器 进行 增 1 操作 。 因 为 结构 体 是 main 中 的 局 部 变量 ， 
所 以 分 配给 各 计数 器 的 内 存 空间 在 main 函数 返回 前 一 直 保存 着 。 


14.3.3 线程 内 部 的 分 工 合作 : 小 结 


进程 的 数据 空间 包含 了 所 有 属于 它 的 变量 。 此 进程 中 运行 的 所 有 线程 都 拥有 对 这 些 变 
量 访问 的 权限 。 如 果 这 些 变量 值 不 变 的 话 ,线程 可 以 无 误 地 读 取 并 使 用 它们 的 值 . 

人 不 过 如 果 进程 中 的 任何 线程 修改 了 一 个 变量 值 ,所 有 使 用 此 变量 的 线程 必须 采用 某 种 
策略 来 避免 访问 冲突 。 在 某 一 时 刻 , 只 有 惟一 的 线程 可 以 对 变量 进行 访问 。 

子 数 统计 程序 的 三 个 不 同 版 本 显示 了 三 种 不 同 的 方法 来 进行 线程 间 的 变量 共享 ， 在 
twordcountl. c 中 使 用 的 第 一 种 方法 ,允许 线程 无 任何 合作 来 修改 同一 个 变量 ， 这 个 程序 本 
身 存在 着 很 大 问题 。 
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程序 twordcount2. c 中 使 用 了 第 二 种 方法 。 这 种 方法 使 用 一 个 互 斥 对 象 来 保证 在 某 一 
时 刻 ,只 有 惟一 的 一 个 线程 对 计数 器 进行 修改 。 此 程序 虽然 解决 了 问题 ,但 是 由 于 对 设置 和 
释放 互 斥 锁 太 多 的 调用 导致 了 系统 性 能 的 降低 。 

twordcount3. c 中 使 用 的 第 三 种 方法 是 一 种 改进 的 方法 。 ME 个 线程 创建 了 
各 目的 计数 器 ,这 样 避免 了 共享 计数 器 的 麻烦 。 所 有 的 线程 不 需要 再 共享 一 个 变量 ,因此 也 
不 用 互相 合作 了 。 不 过 尽管 如 此 ,每 一 一 个 单独 的 线程 仍 需 和 原先 的 线程 进 行 合作 特别 地 ， 
原 线程 不 应 在 其 他 线程 返回 之 前 读 取 它们 各 自 计数 器 的 内 容 。 在 这 种 情况 下 , 原 线 程 使 用 
pthread join 机 数 使 自己 挂 起 直到 线程 已 返回 。 当 某 一 计数 线程 返回 的 时 候 , 对 于 pthread _ 
join 的 调用 激活 原 线程 ,允许 其 访问 计数 器 并 且 也 告诉 main 函数 该 是 读 取 计 数 器 值 的 时 
ET. 

第 三 个 版 本 的 程序 展示 了 如 何 传递 多 个 参数 给 某 一 线程 中 的 函数 。 即 先 创 建 一 个 结构 
类 型 变量 让 它 包 含 所 有 的 参数 ,再 将 此 结构 体 的 地 址 传 给 函数 。 于 是 线程 可 读 取 或 修改 此 
结构 体 中 的 任意 成 员 变 量 了 。 任 何 访问 此 结构 体 的 函数 都 可 以 看 见 值 的 不 断 变 化 。 当 然 ， 
如 果 不 止 一 个 线程 需要 修改 这 些 值 的 时 候 , 就 又 得 借助 于 互 斥 量 来 避免 访问 冲突 了 。 


14.4 ”线程 与 进程 


Unix 从 其 产生 伊始 就 将 进程 作为 它 的 重要 组 成 部 分 而 线程 是 后 来 才 加 进去 的 。 进 程 的 
概念 非常 清晰 且 统 一 。 而 线程 却 有 着 一 系列 的 起 源 , 它 们 的 属性 也 各 不 相同 。 这 里 的 例子 
用 了 一 个 叫做 POSIX 的 线程 接口 。 在 这 里 当然 忽略 了 效率 和 调度 的 问题 ,这 些 由 你 所 使 用 
的 Unix 版 本 和 线程 版 本 所 决定 。 

进程 与 线程 有 根本 上 的 不 同 。 每 个 进程 有 其 独立 的 数据 空间 文件 描述 符 以 及 进程 的 
ID。 而 线程 共享 一 个 数据 空间 .文件 描述 符 以 及 进程 ID。 下 面 这 些 概念 对 于 程序 员 来 说 是 
非常 重要 的 。 

(1) 共享 数据 空间 

这 里 考虑 一 个 在 存储 器 中 存储 了 巨大 而 复杂 的 树 结构 数据 库 的 数据 库 系统 。 多 个 线程 
可 以 轻易 地 读 取 到 这 个 共享 的 数据 集 。 客 户 的 多 个 查询 可 以 由 一 个 进程 来 实现 。 如 果 变 量 
ARRUE ,共享 这 个 数据 空间 不 会 导致 任何 问题 。 

骨 考 虑 一 个 使 用 malloc 和 free 系统 调用 来 管理 内 存 的 程序 。 一 个 线程 分 配 了 一 块 空 间 
仓储 一 个 字符 串 。 当 此 线程 做 其 他 事情 的 时 候 , 另 一 个 线程 使 用 free 释放 了 这 块 空间 。 那 
么 原先 的 线程 中 本 来 指向 此 空间 的 指针 现在 指向 了 一 块 已 经 被 释放 的 地 方 ,更 糟糕 的 是 ,这 
块 地方 已 经 被 派 上 别 的 用 处 了 。 

线程 机 制 还 会 带 来 内 存 的 转 积 。 程序 员 往 往 因为 怕 影 响 了 菜 线程 正在 使 用 的 内 存 空 
间 ,只 分 配 而 不 释放 存储 区 域 。 这 直接 导致 了 内 存 的 转 积 ,使 用 完毕 也 得 不 到 释放 。 

在 单线 程 环境 中 返回 指向 静态 局 部 变量 的 指针 的 函数 无 法 兼容 于 多 线程 环境 。 因 为 
同样 

的 区 数 可 能 在 多 个 线程 中 同时 被 调用 而 导致 结果 出 错 。 

简 而 言 之 ,如 果 共 享 的 变量 很 多 日 定义 的 不 好 ,调试 一 个 多 线程 的 应 用 程序 将 会 是 专 梦 
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一 场 。 
(2) 共享 的 文件 描述 符 
在 fork 原 语 被 调用 之 后 ,文件 描述 符 自动 地 被 复制 ,从 而 子 进程 得 到 了 一 套 新 的 文件 描 
述 符 。 在 子 进程 关闭 了 某 一 个 从 父 进程 那里 继承 来 的 文件 描述 符 之 后 ,此 描述 符 对 父 进程 
来 说 仍然 是 打开 的 。 

在 多 线程 程序 中 ,很 有 可 能 会 将 同一 个 文件 描述 符 传递 给 两 个 不 同 的 线程 。 即 传递 给 它 

们 的 两 个 值 指向 同一 个 文件 描述 符 。 显 然 如 果 一 个 线程 中 的 函数 关闭 了 这 个 文件 ,此 
X FF fü 

述 符 对 此 进程 中 的 任何 线程 来 说 都 已 经 被 关闭 。 然 而 其 他 线程 或 许 仍然 需要 对 此 文件 
描述 符 的 连接 。 | 

(3) fork.exec,exit, Signals 

所 有 的 线程 都 共享 同一 个 进程 。 如 果 一 个 线程 调用 了 exec, 系统 内 核 用 一 个 新 的 程序 
取代 当前 的 程序 从 而 所 有 正在 运行 的 线程 都 会 消失 。 并 且 如 果 一 个 线程 执行 了 exit, 那 么 束 
个 进程 都 将 结束 运行 。 想 想 要 是 线程 的 运行 导致 了 内 存 段 异常 或 者 系统 错误 或 是 线程 出 
省 , 瘫 疾 的 是 整个 进程 ,而 不 是 某 个 线程 本 身 了 。 

fork 创建 了 一 个 新 的 进程 ,并 把 原 调用 进程 的 数据 和 代码 复制 给 这 个 新 的 进程 。 如 果 
线程 中 的 某 函 数 调用 了 fork ,那么 其 他 的 线程 是 不 是 也 会 被 复制 给 新 的 进程 呢 ? 答案 是 否定 
的 ,只 有 调用 fork 的 线程 在 新 的 进程 中 运行 。 试 想 一 下 如 果 在 fork 发 生 的 时 刻 , 另 一 个 线程 
正在 修改 数据 , 那 结 果 如 何 呢 ? 在 什么 情况 下 这 些 数据 会 被 复制 到 新 的 进程 中 呢 ? 

信号 量 (Signal) 的 使 用 要 比 线程 复杂 多 了 。 进 程 可 以 接收 任何 种 类 的 信号 量 。 那 么 哪 
些 线程 可 以 收 到 信和 号 量 ? 是 不 是 所 有 线程 都 可 以 呢 ? 如 果 这 些 信号 量 是 由 内 存 段 异常 或 系 
统 错误 引发 的 又 将 如 何 ? 线程 与 信号 量 的 细节 可 参考 Unix 的 使 用 手册 ， 

(4) 动手 做 一 做 

这 一 章 介 绍 了 线程 的 基本 知识 、 主 要 问题 以 及 多 线程 程序 设计 细节 ， 对 于 这 一 章 的 最 
好 的 练习 就 是 对 于 同一 个 问题 设计 两 种 不 同 的 解决 方案 ,一 个 使 用 线程 , 另 一 个 使 用 进程 ， 
骨 看 一 看 哪 一 个 容易 设计 编码 以 及 调试 ; 哪 一 个 运行 的 快 一 些 ， 哪 一 个 又 更 适用 与 兼容 
Unix 的 各 种 版 本 呢 ? 


14.5 线程 间 互 通 消息 


青 看 一 下 上 面 的 多 线程 字数 统计 程序 。 假 设 你 是 一 个 大 城市 选举 的 负责 人 。 城 市 中 小 
一 忌 的 选区 很 快 就 完成 了 统计 票数 的 工作 ,然而 你 却 要 等 到 所 有 的 数字 都 出 来 之 后 才能 宣 
布 这 个 重要 的 结果 。 不 过 你 希望 在 每 个 选区 票数 出 来 之 后 立即 可 以 看 到 结果 ， 

在 文件 中 统计 数字 就 像 是 选区 统计 票数 一 样 。 有 些 文件 比较 大 ,因此 就 需要 较 长 的 时 
间 来 做 统计 。 看 一 看 如 果 下 面 的 命令 被 运行 后 ,结果 是 什么 样 的 ; 


twordcount really - big - file tiny- file 


原 线 程 使 用 pthread wait 来 等 候 第 一 个 和 第 二 个 线程 返回 。 在 这 个 例子 当中 ,统计 第 
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一 个 文件 要 比 第 二 个 文件 的 时 间 长 的 多 。 那 么 在 第 二 个 线程 完成 之 后 ,如 何 来 通知 原 线 
程 呢 ? 

一 个 线程 是 如 何 与 另 一 个 线程 互通 消息 的 呢 ? 在 一 个 计数 线程 完成 任务 之 后 , 它 是 如 
何 通知 原 线程 它 的 结果 已 经 产生 了 呢 ? 对 于 进程 来 说 , 当 子 进程 终止 后 ,系统 调用 wait ik 
回 。 是 不 是 对 于 线程 的 处 理 也 有 类 似 的 机 制 呢 ? 某 个 线程 是 否 也 可 以 等 待 其 他 线程 完成 ? 
答案 是 否定 的 。 线 程 无 法 按照 这 种 方法 工作 。 因 为 对 于 线程 而 言 并 没有 父 线程 、 子 线程 的 
概念 ,因此 并 不 存在 某 一 个 明显 的 线程 可 以 去 通知 。 


14.5.1 通知 选举 中 心 
某 选 区 完成 计 票 后 ,将 其 结果 发 送 给 管理 中 心 看 一 下 下 面 的 这 个 方法 ,此 方法 是 用 来 从 


选区 得 到 选票 ,然后 将 其 发 送 给 管理 中 心 ( 也 许 看 起 来 有 些 古 怪 , 不 过 线程 确实 就 是 用 这 种 “ 


方法 来 与 另外 的 事件 互通 消息 ) 。 

(1) 在 选举 中 心 有 一 个 投递 选举 报告 的 邮箱 。 这 个 邮箱 在 某 一 时 刻 只 能 接收 一 份 票数 
报告 。 
此 邮箱 前 有 一 面 旗帜 , 它 可 以 被 升 起 来 ,但 很 快 就 会 被 恢复 至 原 位 。 

(2) 选举 中 心 等 待 这 面 旗帜 升 起 来 。 

(3) 某 选 区 负责 人 将 选区 统计 结果 放 人 邮箱 中 。 

(4) 某 选 区 负责 人 将 邮箱 的 旗帜 升 起 (发 送信 和 号) 。 

(5) 选区 中 心 看 到 旗帜 升 起 来 了 , 便 执 行 下 列 步骤 : 

。 从 邮箱 中 取出 选区 的 统计 报告 ; 

。 处 理 此 统计 报告 ; 

。 回 到 原来 的 地 方 继续 等 待 , 即 循环 转 至 步骤 (2) 。 

上 面 的 策略 起 初 看 起 来 有 些 古 怪 , 但 确实 很 有 意义 。 发 送 方 将 数据 存 人 容器 中 , 然 

后 升 起 一 面 旗帜 来 通知 接收 方 数据 已 经 准备 好 了 。 

14. 8 清楚 地 展现 了 选举 中 心 与 两 个 选区 之 间 的 关系 。 每 一 个 选区 将 自己 的 报告 放 人 
邮箱 中 ,然后 通知 选举 中 心 来 取 。 最 后 选举 中 心 处 理 了 报告 。 在 这 个 例子 中 升旗 帜 的 技术 
术语 叫做 发 送信 和 号, 即 接收 方 在 等 待 信号 的 到 来 。 当 然 , 这 里 只 是 个 比喻 ,对 旗帜 的 操作 与 
Unix 里 的 信号 量 机 制 一 点 关系 也 没有 ,两 者 仅仅 是 基本 思路 相同 而 已 。 





选举 中 心 
14.8 使 用 加 锁 的 邮箱 来 传递 数据 
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从 图 14. 8 中 还 可 以 看 到 另外 一 样 东西 : 邮箱 上 有 一 把 锁 。 邮 箱 仅仅 可 以 容纳 一 份 报 
告 , 因 此 在 某 个 时 刻 只 能 有 一 人 拥有 对 邮箱 访问 的 权限 。 虽 然 锁 的 加 入 使 邮箱 结构 看 起 来 
有 些 复杂 ,但 却 使 得 邮箱 相当 可 靠 。 使 用 锁 机 制 的 邮箱 系统 ,其 完整 的 过 程 如 下 。 

(1) 选举 中 心 建 一 个 投递 选举 报告 的 邮箱 。 

此 邮箱 在 某 个 时 刻 只 能 容纳 一 份 选举 报告 。 

此 邮箱 旁 有 一 面 旗帜 , 它 可 以 被 升 起 来 ,但 很 快 就 会 被 恢复 至 原 位 。 

此 邮箱 有 一 把 互 斥 的 锁 , 可 以 被 锁 住 或 打开 。 

(2) 选举 中 心 将 邮箱 锁 打 开 ,然后 等 待 旗帜 信号 的 到 来 。 

某 选 区 负责 人 等 在 邮箱 口 ,直到 它 可 以 将 邮箱 锁 住 。 

如 果 邮 箱 非 空 ,选区 负责 人 先 将 邮箱 锁 打 开 , 等待 着 旗帜 信号 的 到 来 ,然后 再 将 邮箱 


选区 负责 人 将 选举 报告 放 人 邮箱 中 。 

(3) 选区 负责 人 将 旗帜 升 起 ,把 信号 发 出 去 。 

选区 负责 人 把 邮箱 上 的 锁 打开 。 

(4) 选举 中 心 看 到 旗帜 信号 ,停止 等 待 。 
选举 中 心 锁 住 邮箱 。 

选举 中 心 将 选举 报告 拿 出 。 

选举 中 心 处 理 该 选举 报告 。 

选举 中 心 升 起 旗帜 ,以 防 某 一 选区 负责 人 已 经 等 待 了 很 久 。 
选举 中 心 转 向 步骤 (2) 。 


14.5.2 使 用 条 件 变量 编写 程序 


下 面 将 计算 投票 数目 的 系统 转换 成 字数 统计 的 程序 。 计 票 系统 使 用 了 三 种 设备 : 容器 、 

旗帜 和 锁 。 这 三 种 不 同 的 设备 对 应 了 线程 编程 中 的 三 项 : 一 个 变量 保存 数据 、 一 个 条 件 
对 象 和 一 个 互 斥 量 。 图 14. 9 展示 了 三 个 线程 和 三 个 变量 。 一 个 变量 用 作 指 向 字数 计数 器 的 
指针 ,一 个 变量 用 作 条 件 对 象 ,而 另 一 个 变量 用 作 互 斥 量 。 

研究 一 下 程序 的 内 在 逻辑 。 原 线程 启动 了 两 个 计数 线程 然后 开始 等 待 结果 的 到 来 。 特 
别 地 , 原 线程 调用 pthread_cond_wait 函数 来 等 待 “ 旗 帜 升 起 ”。 这 个 系统 调用 将 原 线程 
挂 起 。 

当 某 一 计数 线程 完成 计数 后 ,此 线程 通过 把 指针 存 人 “邮箱 ”变量 的 方法 来 传递 结果 。 
首先 ,此 线程 对 此 邮箱 加 锁 ; 然 后 线程 检查 邮箱 ;如 果 邮 箱 非 空 ,线程 把 邮箱 锁 打 开 并 等 待 着 
信号 的 到 来 ;之 后 ,线程 再 一 次 把 邮箱 锁 住 ,并 把 结果 放 人 邮箱 ;最 后 ,计数 线程 调用 了 函数 
pthread_cond_signal ,将 条 件 变 量 flag 这 面 “ 旗 帜 ” 升 起 来 。 

此 时 由 于 执行 pthread_cond_wait 而 挂 起 等 待 条 件 变 量 flag 变化 的 原 线程 被 计数 线程 
发 出 去 的 信号 唤醒 了 。 原 线程 急切 地 想 冲 过 去 打开 邮箱 ,然而 此 时 的 邮箱 仍然 被 计数 线程 
锁 在 那里 。 

当 计数 线程 通过 调用 pthread_mutex_unlock 把 邮箱 锁 打 开 之 后 , 原 线程 终于 得 到 了 对 
这 把 锁 的 控制 权 。 原 线程 将 选举 报告 从 邮箱 中 拿 出 来 ,在 屏幕 上 显示 出 来 ,再 将 其 加 到 总 数 
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人 


存储 数据 的 变量 
通知 读者 的 信和 号 EFE 





初始 线程 


图 14.9 用 加 锁 的 变量 机 制 来 传递 数据 


中 去 。 然 后 原 线程 发 出 信号 ,以 防 别 的 计数 线程 正在 等 待 。 最 后 原 线 程 循环 回去 ,继续 调用 
pthread cond wait 函数 ,自动 将 互 斥 量 解锁 ,并 将 自己 挂 起 直到 下 一 次 的 信号 到 来 。 

上 面 一 段 所 讨论 的 步骤 恰好 对 应 于 投票 系统 的 原型 ,也 同样 对 应 于 下 面 将 看 到 的 
twordcount4. c 中 的 代码 : 


/x twordcount4.c — threaded word counter for two files. 
x — Version 4: condition variable allows counter 
x functions to report results early 


* 


# include <stdio. h> 
it include — pthread. h> 
# include — ctype. h> 


struct arg set | /* two values in one arg */ 
char * fname; /* file to examine */ 
int count; /x number of words */ 


ls 

struct arg set * mailbox; 

pthread mutex t lock - PTHREAD MUTEX INITIALIZER; 
pthread cond t flag - PTHREAD COND INITIALIZER; 


main(int ac, char x av[ ]) 


{ 


pthread t tl, t2; /* two threads */ 
struct arg set argsl, args2; /x two argsets */ 
void x count words(void *); 


int reports in - 0; 


r 
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int total words = 0; 


if ( ac!» 3 ){ 
printf("usage; % s filel file2\n", avit [0]; 
exit(1); 


j 
pthread mutex lock(&lock); /* lock the report box now x/ 


av[1]; 


argsl.count = 0; 


f 


argsl.fname 


pthread create(&tl, NULL, count words, (void * ) &args1); 


args2.fname - av[2]; 


0. 


f 


Il 


args2. count 


pthread_create(&t2, NULL, count words, (void * ) &args2); 


while( reports in < 2 ){ 
printf("MAIN. waiting for flag to go up\n") ; 
pthread cond wait(&flag, &lock); /* wait for notify x/ 
printf( "MAIN; Wow! flag was raised, I have the lock\n") ; 
printf("% 7d; % s\n", mailbox- >count, mailbox- >fname) ; 
total words += mailbox- —count; 
if ( mailbox == &args1) 
pthread join(tl,NULL); 
if ( mailbox == &args2) 
pthread join(t2,NULL); 
mailbox - NULL; 
pthread cond signal(&flag); 
reports in-*t; 
} 
printf("$ 7d; total words\n", total words); 
| 
void x count words(void * a) 


{ 


struct arg set * args = a; /* cast arg back to correct type x/ 
FILE x fp; 
int c, preve = 'X0'; 


if ( (fp = fopen(args - —fname, "r"))!- NULL ){ 
while( ( c = getc(fp))!= EOF ){ 
if ( ! isalnum(c) && isalnum(prevc) ) 
args 一 >count ++ ; 


prevc = c; 


Li 
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} 

fclose(fp); 
} else 

perror(args - œ> fname); 
printf( "COUNT, waiting to get lock\n") ; 
pthread_mutex_lock(&lock) ; /x get the mailbox x/ 
printf("COUNT, have lock, storing data\n") ; 
if ( mailbox!= NULL ) 

pthread cond wait(&flag,&lock): 


mailbox = args; /* put ptr to our args there x/ 


printf("COUNT; raising flag An"); 


pthread cond signal(&flag); /* raise the flag x/ 
printf("COUNT; unlocking box\n"); 

pthread_mutex_unlock(&lock) ; /* release the mailbox x/ 
return NULL; 


下 面 的 运行 显示 了 时 间 的 发 生 顺 序 : 


$ cc twordcount4.c - lpthread - o twc4 

$ ./twc4 /etc/group /usr/dict/words 

COUNT. waiting to get lock 

MAIN; waiting for flag to go up 

COUNT; have lock, storing data 

COUNT: raising flag 

COUNT; unlocking box 

MAIN; Wow! Flag was raised, I have the lock 
195; /etc/group 

MAIN; waiting for flag to go up 

COUNT; waiting to get lock 

COUNT: have lock, storing data 

COUNT: raising flag 

COUNT: unlocking box 

MAIN; Wow! flag was raised, I have the lock 
45419, /usr/dict/words 

45614, total words 


14.5.3 使 用 条 件 变 量 的 函数 


在 邮箱 上 用 来 通知 其 他 线程 的 旗帜 就 是 一 个 条 件 变量 。 下 面 函数 的 作用 就 是 使 用 条 件 
变量 进行 通信 。 
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pthread_cond_wait 





目标 使 线程 挂 起 ,等 待 某 条 件 变 量 的 信和 号 
头 文件 # include << pthread. h> 
函数 原型 int pthread, cond, wait (pthread cond t * cond, 
pthread mutex t * mutex); 
参数 cond 指向 某 条 件 变 量 的 指针 
mutex 指向 互 斥 锁 对 象 的 指针 
返回 值 0 成 功 返 回 
errcode 错误 


pthread cond wait 使 线程 挂 起 直到 为 一 个 线程 通过 条 件 变量 发 出 消息 。pthread_cond 
_wait 图 数 总 是 和 互 斥 锁 在 一 起 使 用 。 此 郴 数 先 自动 释放 指定 的 锁 , 然 后 等 待 条 件 变量 的 变 
化 。 如 采 在 调用 此 咀 数 之 前 , 互 斥 量 mutex 并 没有 被 锁 住 ,函数 执行 的 结果 是 不 确定 的 。 在 
返回 原 凋 用 困 数 之 前 ,此 晒 数 自动 将 指定 的 互 斥 量 重新 锁 住 。 


pthread cond signal 


目标 唤醒 一 个 正在 等 候 的 线程 
头 文 件 + include < pthread, h> 
eR m int pthread cond signal(pthread cond t * cond); 
参数 cond 指向 某 条 件 变量 的 指针 
返回 值 0 成 功 返 回 
erreode ”错误 





pthread cond signal 函数 通过 条 件 变 量 cond 发 消息 。 若 没有 线程 等 候 消息 ,什么 都 不 
会 发 生 ; 知 是 多 个 线程 都 在 等 待 ,只 唤醒 它们 中 的 一 个 。 


14.5.4 EIZ) Web 服务 器 例子 


通过 前 面 的 学 习 , 大 家 已 经 了 解 了 POSIX 线程 系统 最 基本 知识 和 技巧 ,包括 如 何 创建 新 
的 线程 .如 何等 候 线程 返回 ,如何 安全 地 在 线程 间 共 享 数 据 以 及 线程 如 何 与 其 他 线程 互通 消 
县。 相信 大 家 已 经 有 足够 多 的 知识 可 以 完成 Web 服务 器 与 复杂 动画 的 制作 。 


14.6 多 线程 的 Web 服务 器 


前 面 的 章 市 已 经 写 了 一 个 Web 服务 器 的 程序 。 服 务 器 使 用 fork 系统 调用 创建 新 的 进 
程 来 处 理 客户 端的 请 求 。Web 服务 器 需要 完成 三 种 操作 :将 目录 列表 返回 ;将 文件 内 容 返 
回 ; 以 及 将 CGI 程序 的 输出 返回 。 

服务 器 需要 新 的 进程 来 运行 CGI 程序 ,但 是 并 不 需要 新 的 进程 来 读 取 目 录 列 表 和 文件 
内 容 。 | 
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14.6.1 Web 服务 器 程序 的 改进 


这 里 对 前 - -个 版 本 的 Web 服务 器 程序 作 了 很 多 修改 。 最 重要 的 是 使 用 函数 pthread_ 
create 替换 了 fork。 在 新 的 版 本 中 客户 端的 请 求 不 再 由 单独 的 进程 来 处 理 , 而 是 由 同一 进程 
的 多 个 线程 来 处 理 。 

另外 还 做 了 两 个 改动 :首先 , 移 除 了 CGI 的 功能 。 后面 的 章节 会 把 这 个 功能 加 上 去 。 其 
次 ,自己 写 了 一 个 对 目录 进行 列表 的 函数 ,而 以 前 的 版 本 是 通过 调用 exec 执行 标准 ls 命令 来 
完成 对 目录 的 列表 的 。 


14.6.2 在 多 线程 的 版 本 允许 一 个 新 的 功能 


多 线程 的 特性 允许 我 们 添加 一 个 新 的 功能 :内 部 统计 。 服 务 器 的 运行 者 通常 希望 知道 
服务 器 的 运行 时 间 .接收 的 客户 端 请 求 的 数目 以 及 发 送 回 客户 端 的 数据 量 。 

因为 对 于 所 有 的 请 求 共享 内 存 空 间 , 可 以 使 用 共享 变量 的 方式 来 进行 统计 。 那 么 用 户 
如 何 访 间 这 些 统计 数据 呢 ? 这 里 加 入 一 个 特殊 的 URL:status。 当 远程 用 户 请 求 此 URL 
时 ,服务 器 将 内 部 的 统计 数据 发 给 客户 端 。 


14.6.3 防止 僵尸 线程 (Zombie Threads) :独立 线程 


现在 来 考虑 为 一 个 技术 细节 。 本 章 中 所 提 到 所 有 的 程序 中 都 使 用 了 pthread_join 函数 
来 等 待 线程 返回 。 每 个 线程 都 占用 了 系统 资源 。 如 果 程 序 员 忘记 使 用 pthread_join 来 收回 
线程 ,这 些 被 线程 所 占用 的 资源 就 无 法 被 回收 ,类 似 于 用 malloc 来 分 配 的 空间 却 没有 用 free 
释放 掉 一 样 。 

在 字数 统计 的 程序 中 , 原 线程 不 得 不 等 待 所 有 的 计数 线程 返回 之 后 , 才 可 以 收集 数据 。 
然而 Web 服务 器 却 没 有 理由 等 待 处 理 请 求 的 线程 返回 。 因 为 原 线程 不 需要 从 这 些 线程 得 到 
任何 返回 数据 。 

这 里 同伴 可 以 刨 建 不 需要 返回 的 线程 , 称 之 为 独立 线程 (Detached Threads) 。 当 函数 执 
行 完毕 之 后 ,独立 线程 自动 释放 它 所 占用 的 所 有 的 资源 ,它们 自身 甚至 也 不 允许 等 待 其 他 的 
线程 返回 。 可 以 通过 传递 一 个 特殊 的 属性 参数 给 函数 pthread_create 来 创建 一 个 独立 线程 。 


/* creating a detached thread */ 

pthread t t; 

pthread attr t attr detached; 

pthread attr init(&attr detached); 

pthread attr setdetached(&attr detached,PTHREAD CREATE DETACHED); 
pthread create(&t,&attr detached, func,arg) ; 


14.6.4 Web 服务 器 代码 
采用 多 线程 方法 实现 Web 服务 器 的 完整 代码 如 下 ， 


/ * twebserv.c - a threaded minimal web server (version 0.2) 
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* usage; tws portnumber 


* features; supports the GET command only 


x runs in the current directory 
x creates a thread to handle each request 
x supports a special status URL to report internal state 


* building, cc twebserv.c socklib.c - lpthread - o twebserv 


*/ 


# include <stdio. h> 

# include <sys/types. h> 
# include < sys/stat. h> 
# include < string. h> 


# include <pthread. h> 
i include <stdlib. h> 
# include <unistd. h> 


# include <dirent. h> 
# include < time. h> 


/* server facts here x/ 


time t server started ; 
int server bytes sent; 


int Server requests; 


main(int ac, char x av|] 
{ 
int sock, fd; 
int * fdptr; 
pthread t worker; 
pthread at&ttt. 


void * handle call(void x); 


if (ac == 1 ){ 
fprintf(stderr, "usage; tws portnum\n") ; 
exit(1); 


j 


sock = make server socket( atoi(av[1]) ); 


if ( sock == -1) { perror("making socket"); exit(2); } 
setup(&attr): 
/* main loop here; take call, handle call in new thread x/ 


while(1)( 
fd = accept( sock, NULL, NULL ); 


server requests t* ; 
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fdptr = malloc(sizeof(int)); 
* fdptr = fd; 
pthread create(&worker,&attr,handle call,fdptr); 


} 
/* 


* initialize the status variables and 
* set the thread attribute to detached 
关 / 
setup(pthread attr t * attrp) 
{ 
pthread attr init(attrp); 
pthread attr setdetachstate(attrp,PTHREAD CREATE DETACHED); 


time(&server started); 
server requests - Q0; 


server bytes sent = 0; 


void * handle call(void * fdptr) 
{ 

FILE  * fpin; 

char request[BUFSIZ]; 

int fd; 


f 


fd = x (int x)fdptr; 
free(fdptr); /* get fd from arg x/ 


fpin = fdopen(fd, "r"); /* buffer input x/ 
fgets(request,BUFSIZ,fpin); /* read client request x/ 
printf("got a call on %d; request = %s", fd, request); 
Skip rest of header(fpin); 


process rq(request, fd); /* process client rq x/ 


fclose(fpin); 


[x -一 一 ~ 一 一 一 
Skip rest of header(FILE x) 


Skip over all request info until a CRNL is seen 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一- -一 一 uoc 


skip rest of header(FILE x fp) 


{ 
charbuf[BUFSIZ] = []; 


while( fgets(buf,BUFSIZ,fp) != NULL && strcmp(buf, "\r\n,") 
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process rq( char * rq, int fd ) 

do what the request asks for and write reply to fd 
handles request in a new process 

rq is HTTP command; GET /foo/bar.html HTTP/1.0 


process rq( char * rq, int fd) 
1 
char cmd[ BUFSIZ], arg[ BUFSIZ]; 


if ( sscanf(rq, ,"%s%s,", cmd, arg) {= 2) 
return; 
sanitize(arg); 


printf("sanitized version is % s\n", arg); 


if ( strcmp(cmd, "GET") != 0) 
not implemented(): 
else if ( built in(arg, fd) ) 
else if ( not exist( arg ) ) 
do 404(arg, fd); 
else if ( isadir( arg ) ) 
do ls( arg, fd); 
else 
do cat( arg, fd); 
j 
/* 
* make sure all paths are below the current directory 
*/ 
sanitize(char x str) 
{ 


char * src, * dest; 
src = dest = str; 


while( x src ){ 
if ( strncmp(src,"/../",4) --0) 
Src += 3; 
else if ( strnomp(src, "//",2) 2-0) 
srctt: 


else 
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xdesttt = x*srctt; 
} 
x dest = ,'\0,'; 
if ( * str =='/' ) 
strcpy(str,str t 1); 
if ( str[0] == 'NO' || stremp(str,"./") ==0 


|| stremp(str,"./..") 20) 


strcpy(str,". "); 


/x handle built ~ in URLs here. Only one so far is "status" x/ 
built in(char x arg, int fd) | 


{ 
FILE x fp; 


if ( stremp(arg,"status") != 0) 
return 0; 


http reply(fd, &fp, 200, "OK", "text/plain",NULL); 


fprintf(fp,"Server started; $ s", ctime(&server started)); 
fprintf(fp,"Total requests, % din", server requests); 
fprintf(fp, "Bytes sent out, & d\n", server bytes sent); 
fclose(fp); 


return 1; 


http reply(int fd, FILE x x fpp, int code, char * msg, char x type, char x content) 
1 

FILE * fp = fdopen(fd, "w"); 

int bytes = 0; 


if ( fp != NULL ){ 
bytes = fprintf(fp, "HTTP/1.0 %d %s\r\n", code, msg); 
bytes += fprintf(fp, "Content-type; %s\r\n\r\n", type); 
if ( content ) 
bytes += fprintf(fp," € s\r\n", content); 
} 
fflush(fp); 
if ( fpp ) 
* fpp = fp; 
else 
fclose(fp); 


return bytes; 
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simple functions first, 
not implemented(fd) | unimplemented HTTP command 


and do 404(item,fd) no such object 


-一 一 一 一 -一 一 一 一 一 -一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 -一 一 一 一 一 一 一 cL ll l.l. LL a Lua a —— 


not implemented(int fd) 


{ 
http reply(fd,NULL,501, "Not Implemented", "text/plain" 


"That command is not implemented"); 


do 404(char x item, int fd) 
{ 
http_reply(fd, NULL, 404, "Not Found", "text/plain", 


"The item you seek is not here"); 


the directory listing section 


isadir() uses stat, not_exist() uses stat 


isadir(char x f) 
( 


struct stat info; 
return ( stat(f, &info) != - 1 && S ISDIR(info.st mode) ); 


not exist(char x f) 


struct stat info: 


return( stat(f,&info) == -1 ); 


do_ls(char * dir, int fd) 
{ 
DIR * dirptr; 
struct dirent x direntp; 
FILE * fp; 
int bytes = 0; 


bytes = http reply(fd,&fp,200, "OK", "text/plain",NULL); 
bytes += fprintf(fp, "Listing of Directory % s\n", dir); 


if ( (dirptr = opendir(dir)) !- NULL ){ 
while( direntp = readdir(dirptr) )| 
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bytes += fprintf(fp, "%s\n", direntp- —d name); 
} 
closedir(dirptr) ; 


} 
fclose(fp); 


server bytes sent += bytes; 


functions to cat files here. 


file type(filename) returns the 'extension',; cat uses it 


char x file type(char * f) 
{ 
char * cp; 
if C (cp = strrchr(f,'.' )) != NULL) 
return cp+1; 


return" —"; 
E 
/* do cat(filename,fd); sends header then the contents */ 


do cat(char xf, int fd) 
( 


char * extension = file type(f); 
char * type = "text/plain "; 
FILE x fpsock, * fpfile; 

intc; 


intbytes = 0; 


if ( strcemp(extension, "html ") ==0 ) 
type = "text/html"; 

else if ( strcmp(extension, "gif") ==0 ) 
type = "image/gif"; 

else if ( strcmp(extension, "jpg") ==0 ) 
type = "image/jpeg"; 


else if ( strcmp(extension, "jpeg") ==0 ) 


type = "image/jpeg": 


fpsock = fdopen(fd, "w"); 

fpfile = fopen( f , "r"); 

if ( fpsock 1= NULL && fpfile != NULL ) 

{ 
bytes = http_reply(fd,&fpsock,200, "OK", type, NULL) ; 
while( (c = getc(fpfile) ) != EOF ){ 
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putc(c, fpsock); 
bytes 十 十 ， 
fclose(fpfile); 
fclose(fpsock); 
} 


server_bytes_sent += bytes; 
} 


此 程序 虽然 能 够 正常 工作 ,但 还 是 有 一 个 问题 ;统计 的 功能 使 用 共享 变量 机 制 ,但 共享 
的 变量 并 未 被 互 斥 锁 所 保护 。 加 入 互 斥 锁 的 功能 就 留 给 大 家 作为 练习 。 


14.7 线程 和 动画 


Web 服务 盏 程序 不 需要 线程 也 可 以 工作 , 因为 可 以 使 用 fork 来 处 理 并 发 的 请 求 。 然 而 
如 采 没 有 引入 线程 机 制 , Web 浏览 器 却 无 法 轻易 地 使 画面 和 广告 动 起 来 。 对 线程 的 下 一 个 
应 用 是 如 何 用 多 线程 来 控制 动画 。 

在 视频 游戏 那 一 章 中 , 使 用 了 定时 器 来 控制 动画 。 定 时 器 以 一 个 特定 的 时 间 间 隔 来 发 
送 SIGALRM 消息 ,信号 处 理 者 使 用 计数 器 来 决定 何 时 移动 图 片 。 


14.7.1 使 用 线程 的 优点 


信和 号 处 理 者 和 定时 器 的 机 制 虽然 可 以 完成 工作 ,但 线程 机 制 更 好 地 匹配 了 内 部 和 外 部 的 结 
构 。 在 外 部 ,用 户 可 以 看 见 两 个 独立 的 活动 流程 :动画 和 键盘 控制 ,如 图 14. 10 所 示 。 


动画 线程 会 用 到 关于 
动画 的 设置 


mud 处 理 键盘 事件 的 线程 
会 修改 动画 的 设置 


图 14. 10 动画 图 片 及 其 键盘 控制 





在 内 部 ,线程 可 以 将 控制 动画 代码 和 键盘 输入 代码 分 开 。 如 图 14. 11 所 示 ,线程 间 通 过 
共享 变量 方式 定义 位 置 .动画 速度 。 

当然 ,画面 的 移动 还 是 通过 隐藏 的 定时 器 来 完成 的 ,但 多 线程 的 解决 方案 让 我 们 更 关注 
于 程序 的 组 织 结构 。 

多 线程 与 原先 的 方法 相 比 还 有 另外 一 个 好 处 。 现 代 的 线程 库 允 许 不 同 的 线程 运行 在 不 
同 的 处 理 器 芯片 上 ,从 而 实现 了 真正 意义 上 的 并 行 。 对 于 动画 而 言 ,其 轨道 .旋转 以 及 纹理 
的 绘制 都 需要 复杂 的 计算 ,因此 在 多 个 处 理 器 上 运行 线程 可 以 提供 更 快 的 处 理 速度 和 更 加 
精细 的 画面 。 
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动画 设置 





键盘 线程 动画 线程 
14.11 动画 线程 及 键盘 线程 


14.7.2 多 线程 版 本 的 bounceld. c 
比较 一 下 原先 版 本 bounceld. c 与 新 的 两 线程 版 本 tbounceld. c 的 区 别 : 


/* h tbounceld.c; controlled animation using two threads 


x note one thread handles animation 
x other thread handles keyboard input 
* compile cc tbounceld.c - lcurses - lpthread - o tbounceld 


# include <stdio. h> 

# include <curses. h> 
# include <pthread. h> 
it include — stdlib. h> 
it include — unistd. h> 


/* shared variables both threads use. These need a mutex. x/ 


it define MESSAGE " hello" 


int row; /* current row x/ 
int col; /* current column */ 
int dir; /x where we are going «/ 
int delay; /* delay between moves x/ 
main() 
( 
int ndelay; /* new delay x/ 
int c; /* user input */ 
pthread t msg thread; /* a thread x/ 


void x moving msg(); 


initscr(); /* init curses and tty x/ 
crmode() ; 
noecho() ; 











—— a 
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clear(); 
row = 10; /* start here x/ 
col = 0; | 
dir - 1; /* add 1 to row number x/ 
delay = 200; /* 200ms = 0.2 seconds x/ 


if ( pthread create(&msg thread,NULL,moving msg,MESSAGE) ) { 


} 


fprintf(stderr, "error creating thread"); 
endwin(); 


exit(0). 


while(1) 1 


j 


ndelay = 0; 
c = getch(); 
if (c == 'Q') break; 
if (ce == ' ') dir = -dir; 
if (c == 'f' & delay > 2 ) ndelay = delay/2; 
if (c == 's!') ndelay = delay * 2; 
if ( ndelay > 0 ) 
delay = ndelay ; 


pthread cancel(msg thread); 


endwin(); 


} 


void * moving msg(char * msg) 


{ 


while( 1 ) { 
usleep(delay x 1000); /* sleep a while x/ 
move( row, col ); /* set cursor position x/ 
addstr( msg 5; /* redo message x/ 
refresh(); /* and show it x/ 


j 


/* move to next column and check for bouncing x/ 


col += dir; /* move to new column x/ 
if (col < = O&&dir == -1) 

dir = 1; 
else if ( col + strlen(msg) > = COLS & dir == 1) 

dir = 一 1; 


新 版 本 的 动画 程序 与 老 版 本 的 单线 程 程序 有 何 区 别 呢 ? 最 大 的 不 同 之 处 在 于 main 函 
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数 中 创建 了 一 个 新 的 线程 来 执行 moving msg PEZ. moving msg 函数 执行 了 一 个 简单 的 循 
环 :sleep,move, 检 查 跳 妈 ,repeat。 同 时 ,在 同一 个 进程 的 另 一 部 分 ,main PR CU, DET — A fe] 
单 的 循环 :getch, 处 理 ,repeat。 

修改 后 的 程序 仍然 用 全 局 变量 表示 球 的 状态 。 在 基于 中 断 的 版 本 中 ,必须 使 用 全 局 变 
量 , 因 为 无 法 将 参数 传 给 信号 处 理 者 。 然 而 线程 机 制 却 允 许 线程 接收 参数 ,因此 可 以 像 上 面 
字数 统计 程序 的 第 三 .第 四 版 本 一 样 ,通过 创建 结构 体 ,并 将 其 地 址 传 给 线程 的 方式 来 改进 
RH. 
14.7.3 基于 多 线程 机 制 的 多 重 动 画 : tanimate. c 

怎样 才 可 以 同时 使 多 条 消息 活动 起 来 呢 ? 多 线程 的 字数 统计 程序 并 发 地 运行 了 多 个 字 
数 统计 函数 的 实例 ,每 一 个 调用 都 传递 给 此 函数 一 个 文件 名 和 一 个 独立 的 计数 器 。 用 同样 
的 道理 可 以 运行 并 行 的 动画 。 

下 面 的 多 线程 动画 程序 tanimate. c 是 tbouncel. c 的 一 个 扩展 。tanimate. c 最 多 可 以 接 
受 10 个 命令 行 的 参数 ,使 每 一 个 参数 在 不 同 的 行 上 移动 ,并 且 有 自己 独立 的 速度 和 方向 。 例 
如 ,下 面 的 命令 


tanimate 'Buy this' 'Drive this car' 'Spend Money here' Consume '1Buy! ' 


将 产生 一 个 包含 多 种 跳动 的 动画 消息 ,如 图 14.12 HER 









Buy this! 
Drive this car! 
Spend money here! 






Consume! 





Buy! 








'Q'..'4' to bounce 


图 14.12 多 种 跳动 的 动画 消息 


用 户 可 以 通过 按键 %0”“1” 等 使 处 在 该 行 上 的 消息 跳动 。 
也 可 以 使 一 组 字符 串 活动 起 来 ,甚至 是 那些 Unix 的 工具 ,可 以 尝试 下 面 的 命令 : 


tanimate ‘is! 
tanimate 'users' 
tanimate 'date' 


tanimate 在 不 同 的 线程 中 运行 控制 动画 的 函数 。 这 个 函数 的 每 一 个 实例 都 接收 到 原始 
线程 所 传 的 一 组 不 同 的 参数 。 参 数 指定 了 消息 名 称 、 行 号 移动 方向 以 及 速度 : 


/* tanimate.c; animate several strings using threads, curses, 


x usleep() 
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* 


* bigidea one thread for each animated string 


x one thread for keyboard control 

x shared variables for communication 

* compile cc tanimate.c 一 lcurses - lpthread - o tanimate 
* to do needs locks for shared variables 

x nice to put screen handling in its own thread 

x*/ 


i include «stdio. h> 

i include <‘curses. h> 
t include «pthread. h> 
# include < stdlib. h> 
i include <unistd. h> 


# define MAXMSG 10 /* limit to number of strings x/ 
# define TUNIT 20000 /x timeunits in microseconds x/ 


struct propset { 


char x str; /* the message x/ 

int row; /x the row x/ 

int delay; /* delay in time units x/ 
int dir; /* +lor -1x/ 


h; 
pthread mutex t mx - PTHREAD MUTEX INITIALIZER; 


int main(int ac, char x av[ |) 


| 


int C; /* user input x/ 

pthread t thrds[ AXMSG ] ， /* the threads x/ 

struct propset props|[ AXMSG]; /* properties of string */ 
void * animate(); /* the function x/ 

int num msg ; /* number of strings */ 
int i; 

if (ac == 1 ){ 


printf( "usage; tanimate string ..\n"); 


exit(1); 


num msg = setup(ac- l,av + l,props); 


/* create all the threads x/ 
for (i=0 ; i<num msg; itt) 
if ( pthread create(&thrds[ i], NULL, animate, &props[i]))! 
fprintf(stderr, "error creating thread"); 


endwin(); 
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exit(0); 
j 


/x process user input */ 


while(1) | 
c = getch(); 
if(c == 'Q') break; 
if (c == t!) 


for (i= 0;i<cnum_msg;it+ ) 
props[i].dir = - props[i].dir; 
if (c >= '0' &c <= !9' jf 
i = c ~ '0'; 
if ( i < num_msg ) 
props[i].dir = - props[i].dir; 


| 


/* cancel all the threads x/ 

pthread mutex lock(&mx); 

for (i20; i«cnum msg; i++ ) 
pthread_cancel(¢hrds[i]); 

endwin() ; 

return 0; 


} 


int setup(int nstrings, char x strings| |, struct propset props[ ]) 


{ 
int num msg = ( nstrings > MAXMSG ? MAXMSG ; nstrings ); 


int i; 


/* assign rows and velocities to each string x*/ 


srand(getpid()); 


for (i=0 ,i«num msg; i++ )1 
props|i].str = strings[iil; /* the message x/ 
props[i].row = i; /* the row x/ 
props|i].delay = 1+ (rand() $15); /* a speed x/ 
props[ij.dir = ((rand() %2)? 1:- 1); /x 十 1or -1x/ 


| 


/* set up curses */ 

initscr(); 

crmode(); 

noecho() ; 

clear(); 

mvprintw (LINES - 1,0,"'Q' to quit, '0'..'%d' to bounce", 


num msg - 1); 
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return num msg; 


} 


/* the code that runs in each thread x/ 
void x animate(void x arg) 


{ 


struct propset x info = arg; /x point to info block x/ 
int len = strlen(info- >str) +2; /* +2 for padding x/ 
int col = rand() % (COLS ~ Jen- 3); /* space for padding */ 
while( 1) 


{ 
usleep( info- delay x TUNIT); 


pthread mutex lock(&mx); /* only one thread */ 
move( info- >>row, col); /* can call curses x/ 
addch(' '); | /x at the same time */ 
addstr( info- >str ); /x Since I doubt it is */ 
addch(' '); /* reentrant x/ 
move(LINES - 1,COLS ~ 1); /* park cursor x/ 
refresh(); /x and show it */ 

pthread mutex unlock(&mx); /* donewith curses */ 


/x move item to next column and check for bouncing */ 


col + = info- dir; 


if (col < = 0 && info- dir == -1) 
info- dir = 1; 
else if (col + len > = COLS && info- >dir == 1) 
info ~ >dir = -1; 


14.7.4 tanimate. c 中 的 互 斥 量 


上 面 的 程序 ,整个 代码 分 为 三 段 :初始 化 .控制 移动 消息 的 函数 和 一 个 读 取 和 处 理 用 户 
输入 的 循环 。 用 户 输入 循环 在 初始 线程 中 运行 ,而 控制 动画 的 洋 数 却 是 运行 在 好 几 个 线程 
中 。tanimate 可 以 最 多 同时 有 11 个 线程 在 运行 。 在 线程 并 行 运行 过 程 中 ,共享 资源 是 什么 ? 
又 如 何 来 防止 线程 间 的 共享 冲突 呢 ? 

1. 数据 冲突 : 互 斥 量 的 动态 初始 化 

控制 动画 的 函数 可 以 使 用 或 修改 作为 参数 传递 给 它 的 结构 体 成 员 的 值 , 它 们 包括 位 置 、 
速度 以 及 运动 方向 。 当 用 户 使 一 条 消息 跳动 之 后 ,输入 线程 修改 了 结构 体 中 成 员 dir 的 值 。 
大 家 都 知道 ,共享 变量 需要 互 斥 量 来 防止 数据 的 冲突 。 那 么 是 否 需 要 为 所 有 的 方向 变量 ( 即 
结构 体 中 的 成 员 dir) 增 加 一 个 互 斥 量 呢 ? 
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一 个 比较 好 的 方案 是 在 每 一 个 结构 体 中 建 一 个 互 斥 量 。 当 控制 动画 的 线程 和 用 户 输入 
线程 读 取 或 修改 结构 体 中 共享 变量 的 时 候 , 这 个 互 斥 量 开 始 工 作 。 修 改 后 的 结构 体 定 义 
如 下 : 


struct propset{ 


char * str; /* the message x/ 
int row; /x the row x/ 
int delay; /* delay in time units x/ 
int dir; /x +1lor -1 */ 
pthread mutex t lock; /* a mutex for dir x / 
j 
setup 中 的 初始 化 程序 如 下 ， 
for (i=0; i< num msg; i++ ){ 
props[ i]. str = strings[i]; /* the message x/ 
props(i].row = i; /* the row x/ 
props[il.delay = 1+ (rand() %15); /* a speed */ 


props[i].dir = ((randO %2)? 1;- D; /x *10r-1»x/ 
pthread_mutex_init(&props[ i]. lock, NULL); 
} 


程序 中 其 他 的 改进 留 给 大 家 作为 练习 。 

2. 屏幕 冲突 :临界 区 

方 同 变量 并 不 是 惟一 的 共享 资源 。 修 改 屏幕 和 光标 位 置 的 各 函数 同样 也 被 所 有 动画 线 
程 共享 。 可 使 用 互 斥 量 mx 来 防止 对 这 些 函 数 的 同步 访问 冲突 。 

看 一 下 animate 中 的 屏幕 控制 调用 :move ,addch ,addstr 和 refresh。 如 果 两 个 线程 并 发 
地 按照 这 个 顺序 执行 指令 ,那么 结果 会 怎样 ? 举例 来 说 ,如 果 两 个 线程 交替 地 调用 ; move、 
move、addch、addch .addstr、addstr… ,会 导致 什么 样 的 结果 ? 

第 一 个 线程 使 用 move 将 光标 置 于 某 个 屏幕 位 置 ,然后 第 二 个 线程 又 会 将 其 移 到 别 的 地 
方 去 。 然 而 这 时 第 一 个 线程 以 为 光标 还 在 诛 处 ,就 将 一 些 文字 输出 到 这 个 位 置 ,结果 显然 是 
错误 的 1 

由 于 设置 光标 的 库 函 数 不 会 意识 到 线程 的 存在 ,所 以 对 某 个 特定 函数 的 访问 并 不 会 因 
为 多 线程 的 存在 而 受 干扰 。 但 为 了 保证 某 一 时 刻 只 有 一 个 线程 可 以 访问 设置 光标 的 函数 ， 
这 里 同样 使 用 了 互 斥 量 机 制 。 

光标 控制 函数 库 包 含 了 许多 内 部 的 结构 体 。 就 像 用 互 斥 量 来 保护 自 定 义 数 据 结构 一 
E ,这 里 也 使 用 互 斥 量 来 防止 对 系统 系统 库 内 部 的 数据 结构 的 访问 冲突 。 


14.7.5 屏幕 控制 线程 


使 用 互 斥 量 并 不 是 防止 屏幕 控制 冲突 的 惟一 方法 。 另 一 一 个 方法 束 是 创建 一 个 新 的 线程 
来 处 理 所 有 对 屏幕 控制 函数 的 调用 ,如 图 14. 13 所 示 。 
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每 个 移动 的 图 片 由 一 个 独立 的 线程 控制 。 这 些 







附带 很 多 线 的 进程 " 
一 个 线程 读 取 并 [ote €—— 
处 理 用 户 输入 SiE 新 请 求 ， 然 后 
调用 屏幕 处 理 

函数 

答 出 到 屏幕 


图 14. 13 独立 处 理 屏 幕 控 制 的 线程 


可 以 把 这 个 屏幕 控制 线程 看 成 在 一 个 大 公司 中 的 公共 关系 部 门 。 任 何 想 要 向 媒体 发 送 
消息 的 部 门 都 必须 向 公共 关系 部 门 发 送 请 求 。 公 共 关 系 部 门 里 的 员工 只 关心 如 何 将 消息 发 
送出 去 。 

其 实 这 个 屏幕 控制 线程 在 功能 上 就 像 这 个 公关 部 一 样 ,任何 希望 向 屏幕 发 消息 的 线程 
都 必须 向 这 个 屏幕 管理 线程 发 送 请 求 。 

采用 这 种 机 制 之 后 ,每 个 线程 所 发 送 的 请 求 就 应 该 包含 这 些 信 息 : 行 号 、 列 号 和 消息 字 
符 串 。 控 制 动 画 的 线程 发 出 消息 ,屏幕 管理 线程 接 到 消息 后 ,将 其 显示 在 屏幕 上 。 

这 种 生产 者 (发 消息 线程 ) 一 一 消费 者 (接收 消息 线程 ) 的 设计 类 似 于 前 面 学 习 的 多 线程 
版 的 字数 统计 程序 :需要 一 个 存储 变量 来 放置 消息 ,通过 互 斥 量 来 避免 对 此 存储 变量 的 访问 
冲突 ,以 及 一 个 条 件 变量 ,在 动画 线程 发 送 消息 之 后 ,可 以 通过 这 个 条 件 变 量 将 屏幕 控制 线 
程 唤 醒 。 

对 于 屏幕 控制 功能 的 集中 化 和 抽象 化 设计 使 得 程序 更 加 灵活 。 就 算 屏幕 显示 系统 更 换 
本 ,也 只 需 改变 屏幕 控制 线程 中 使 用 的 函数 。 屏 幕 控制 线程 甚至 还 可 以 发 起 同 远 端 显示 服 
务 紫 的 一 个 会 话 , 通 过 管道 或 套 接 字 将 消息 发 过 去 ,然而 这 一 切 对 于 控制 动画 的 线程 来 说 都 
是 透明 的 。 改 进 这 个 程序 就 留 给 大 家 作为 练习 完成 。 


小 结 


1. 主要 内 容 

执行 线路 即 为 程序 的 控制 流程 。pthreads 的 线程 库 允 许 程序 在 同一 时 刻 运行 多 个 
PRI 

同时 执行 的 各 函数 都 拥有 自己 的 局 部 变量 ,但 共享 所 有 的 全 局 变量 和 动态 分 配 的 数 
据 空 间 。 

。 当 线 程 共享 变量 时 ,必须 保证 它们 不 会 发 生 共 享 冲突 。 线 程 使 用 互 斥 锁 来 保证 在 某 
一 时 刻 只 有 一 个 线程 在 对 共享 变量 访问 。 

线程 间 通 过 条 件 变量 来 互相 通知 和 同步 数据 。 一 个 线程 挂 起 并 等 待 着 条 件 变量 按照 
某 种 特定 方式 变化 ,而 另 一 个 线程 则 发 信号 使 得 条 件 变量 发 生变 化 。 

。 线程 需要 使 用 互 斥 量 来 避免 对 于 共享 资源 操作 函数 的 访问 冲突 。 非 重 入 的 函数 必须 
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按照 这 种 方式 进行 保护 。 
2. 下 一 步 做 什么 | 
一 个 程序 可 以 包括 若干 进程 ,进程 之 间 通 过 管道 .文件 ,socket 和 信号 进行 通信 。 程 序 也 
可 以 包含 多 个 线程 ,它们 之 间 通 过 共享 变量 .文件 、. 锁 以 及 信和 号 进行 通信 。 前 一 章 主 要 学 习 
了 进程 间 的 通信 。 那 么 Unix 中 提供 了 多 少 种 通信 方式 呢 ? 如 何 为 你 的 应 用 程序 选择 最 合 
适 的 通信 方法 呢 ? 下 一 章 将 给 出 这 些 问题 的 答案 。 
3. 习题 


14. 1 


14. 2 


14. 3 


线程 基本 操作 的 练习 。 对 hello multi, c 做 如 下 修改 : 

首先 ,多 加 几 条 消息 到 程序 中 ,接着 为 新 加 的 消息 创建 线程 。 

然后 修改 print. msg 函数 中 的 循环 次 数 , 使 其 与 所 要 打印 的 字符 串 的 长 度 一 致 。 
在 每 一 条 pthread_join 语句 之 后 打印 信息 ,以 观察 程序 的 执行 情况 ,并 解释 结果 。 


对 tanimate 使 用 管道 命令 ,tanimate 就 可 以 从 标准 输入 中 读 取 它 的 字符 捉 列 表 。 


”那么 如 下 的 命令 : 


wholtanimate 


就 可 以 起 作用 了 。 将 这 一 功能 添加 进去 并 不 是 一 件 小 事 。 需 要 首先 从 标准 输入 
读 取 字 符 行 ,然后 将 标准 输入 重 定向 到 终端 ,这 样 屏幕 控制 线程 就 可 以 非 标准 的 
模式 读 取 字符 了 (打开 /dev/tty 并 将 它 复制 到 标准 输入 )。 


在 视频 游戏 那 一 章 中 ,大 家 一 定 注意 到 在 代码 的 临界 区 使 用 信号 标记 来 防止 访 
问 冲突 。 将 信号 标记 和 信号 处 理 机 制 与 线程 、 互 斥 锁 以 及 条 件 变 量 机 制 做 一 个 
比较 。 


4. 编程 练习 


14. 4 


14.5 


14. 7 


在 hello. multi. c 中 ,原始 线程 创建 了 两 个 打印 线程 。 写 一 个 新 的 程序 ,在 打印 
“hello” 的 线程 中 创建 一 个 新 的 线程 来 打印 “world\n”。 哪 一 个 线程 等 待 打 印 
“world\n” 的 线程 返回 ?为 什么 ? 


twordcountl. c 用 了 三 个 线程 :初始 线程 和 两 个 计数 线程 ,但 初始 线程 完成 很 少 
的 功能 。 写 一 个 新 程序 ,让 原 线程 统计 第 一 个 文件 的 字数 ,然后 再 创建 一 个 线程 
统计 第 二 个 文件 的 字数 。 这 种 方法 是 否 执行 得 快 一 点 ? 哪 一 种 设计 更 好 ? 


count words 图 数 报错 说 无 法 打开 指定 的 文件 。 尽 管 这 样 另 一 个 线程 仍然 继续 
运行 。 这 样 好 吗 ? 修改 程序 使 count. words 函数 在 打 不 开 文 件 的 时 候 调 用 exit 
退出 运行 。 


如 何 扩 展 twordcount2. c 和 twordcount3. c 中 的 方法 ,让 程序 可 以 在 命令 行 上 接 
收 多 个 文件 ?修改 这 两 个 程序 使 它们 可 以 在 命令 行 上 接收 任意 数目 的 文件 名 。 
哪 一 个 版 本 的 程序 容易 扩展 ? 哪 一 个 更 高 效 呢 ? 
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14.8 进程 与 线程 : 


14. 


14. 


14. 


14, 


14, 


14, 


14, 


14, 


14, 


CD 写 一 个 新 版 本 的 字数 统计 程序 ,用 fork 为 每 个 文件 创建 新 的 进程 。 需 要 为 


子 进程 设计 一 个 系统 ,使 它们 可 以 将 结果 传 回 给 父 进程 使 用 。 不 要 使 用 进程 
退出 值 来 返回 这 个 结果 ,因为 这 个 值 不 能 超出 255。 使 用 fork 的 一 个 好 处 就 
是 可 以 使 用 标准 的 we 一 w 命令 来 统计 每 个 文件 中 的 字符 数 。 

(2) 写 一 个 单线 程 的 字数 统计 程序 。 

(3) 将 这 三 个 版 本 的 程序 (进程 .多 线程 和 单线 程 ) 做 一 下 比较 , 哪 一 个 容易 设计 、 
容易 编码 ? 哪 -一 个 执行 效率 高 ? 哪 一 个 可 移植 性 好 ? 


‘wee 


.9 扩展 twordcount4. c 程序, 使 其 在 命令 行 上 可 以 接收 多 于 两 个 文件 名 。 


10 


11 


12 


14 


15 


16 


17 


18 


将 twordcount4. c 中 的 全 局 变量 作为 main 图 数 的 局 部 变量 ,然后 将 指 回 它们 的 
指针 作为 结构 体 的 成 员 。 再 将 结构 体 地 址 传 给 线程 。 


在 twebserv. c 中 加 入 互 斥 锁 来 保护 对 统计 变量 的 访问 。 


删除 tbounceld. c 中 的 所 有 全 局 变量 。 定 义 一 个 结构 体 来 包含 所 有 跳动 文字 的 
信息 。 


tbounceld. c 程序 中 的 共享 状态 需要 互 斥 锁 机 制 。 如 果 不 加 锁 , 会 导致 什么 样 
KAR? 两 个 线程 冲 罕 会 造成 什么 样 的 结果 ? 


单 宇 符 串 的 动画 程序 包含 了 对 速度 的 控制 。 用 户 可 以 通信 按键 “s” 和 “f” 来 增加 
和 降低 动作 间 的 延 时 ,将 速度 控制 加 入 多 字符 串 动画 程序 中 。 


tanimate. c 中 所 有 的 消息 都 是 水 平移 动 的 。 修 改 程序 使 得 一 些 字 符 串 上 下 移 
动 , 而 另 一 些 水 平移 动 。 如 何 来 控制 冲突 ? 


修改 tanimate 程序 ,使 用 一 个 单独 的 线程 进行 屏幕 管理 。 控 制 动 画 的 线程 必须 
先 将 消息 发 送 给 屏幕 管理 线程 ,由 屏幕 管理 线程 对 消息 进行 显示 。 


MT finger 服务 器 需要 一 个 多 线程 的 服务 器 来 提供 服务 。 服 务 器 每 次 接收 一 行 
输入 。 然 后 服务 器 在 数据 库 中 查询 这 个 字符 串 ,再 将 匹配 这 个 字符 串 的 记录 返 
BAe Pod. ARS abe 17 we a FER: 

CD 将 用 户 数 据 库 载 人 内 存 ; 

(2) 为 每 一 个 请 求 创建 一 个 独立 线程 (detached thread) ; 

(3) 服务 器 记录 每 秒 钟 所 匹配 的 记录 的 数目 ; 

(4) 对 于 STATUS 的 特殊 请 求 ,服务 器 将 返回 统计 数据 ; 

(5) 在 接收 到 SIGHUP 消息 之 后 ,服务 器 刷新 其 内 部 数据 库 。 


在 tanimate 那 一 节 的 结尾 , 曾 讨 论 了 如 何 将 显示 功能 与 计时 和 数据 处 理 逻 辑 分 
开 。 写 一 个 客户 /服务 器 版 本 的 tanimate 程序 ,用 数据 报 的 socket 将 简单 的 请 
求 信息 从 tanimate 程序 发 送 到 显示 服务 器 上 。 
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SCAN ARH a8 CREER: RU B PS AR du m HJ f] CDM : 

CLEAR clears the display 

DRAW R C Any string puts "Any string" at row R,column C 

修改 后 的 版 本 不 再 需要 调用 屏幕 控制 函数 。 它 只 需 向 显示 服务 器 发 送 消息 。 
显示 服务 器 接收 这 些 信 息 , 然 后 把 消息 中 包含 的 字符 串 显 示 出 来 。 在 做 这 道 题 
目的 时 候 , 可 以 去 研究 Unix 使 用 的 X11 window 系统 的 设计 思想 。 











概念 与 技巧 

。 挂 起 并 等 候 从 多 个 源 靖 的 输入 : select 和 poll 
。 命名 管道 

e HEA 

。 文件 锁 

。 信号 量 

* IPC(InterProcess Communication) M Wi 
相关 的 系统 调用 与 函数 

e select,poll 

。 mkfifo 

e shmget,shmat,shmctl , shmdt 

* semget,semctl,semop 

相关 命令 

e talk 

e lpr 


15.1 编程 方式 的 选择 


很 人 以 前 , 当 两 人 试图 互相 交流 的 时 候 , 可 选择 的 方式 非常 的 少 : 交谈 或 者 投掷 石 块 。 
当代 人 们 的 选择 多 了 很 多 : 蜂 寅 电话 、 电 子 邮 件 、 信 件 、 特 快 专递 ,自行 车 投递 .网 络 电 话 、 纸 
张 . 显 示 需 上 巾 的 备 千 录 等 ,当然 也 可 以 直接 交谈 或 投掷 石 块 。 每 种 方法 都 有 其 优点 和 缺 
点 。 那 么 人 们 如 何 选择 其 交流 方式 呢 ? 

作为 一 名 Unix 程序 员 ,必须 学 会 如 和 何 选择 进程 间 通 信 的 方法 。 每 一 种 方式 都 有 其 优 缺 
点 ,如 何 进行 选择 呢 ? 

本 章 从 学 习 talk 开始 。 人 们 使 用 talk 来 互相 发 送 消息 ,并 将 会 比较 讨论 各 种 Unix 方 
法 ,看 看 它们 是 如 何在 进程 间 传 递 消息 的 。 


第 15 3€ ”进程 间 通 信 (IPC) e 465 * 





15.2. talk 命令 : 从 多 个 数据 源 读 取 数 据 


Unix 的 talk 命令 是 一 种 通信 工具 。talk 允许 人 们 在 终端 间 传 送信 息 。talk 甚至 可 以 路 
越 Internet 来 连接 不 同 机 器 的 终端 ,如 图 15. 1 所 示 。 





图 15.1 talk 连接 网 络 上 的 两 个 终端 


使 用 talk 命令 的 时 候 ,屏幕 被 分 为 上 下 两 个 部 分 ,用 户 以 字符 终端 模式 来 操作 输入 字 
符 的 时 候 , 字 符 会 同时 显示 在 两 个 窗口 中 。 你 所 输入 的 字符 会 出 现在 上 面 的 窗口 中 ,而 对 方 
和 输入 的 字 出 现在 下 面 的 窗口 中 。talk 使 用 socket 进行 通信 ,如 图 15. 2 所 示 





15.2 talk 命令 的 工作 方式 


talk 命令 读 取 字 符 并 将 它们 写 到 目的 地 。 但 与 所 学 过 的 其 他 程序 不 同 ,talk 同时 等 待 从 
两 个 文件 描述 符 的 输入 。 


15.2.1 同时 从 两 个 文件 描述 符 读 取 数 据 


talk 从 键盘 和 socket 接收 数据 。 从 键盘 输入 读 取 的 字符 被 复制 到 屏幕 中 上 半 个 窗口 ， 
并 通过 socket 发 送出 去 。 同 样 从 socket 读 入 的 字符 被 添加 到 屏幕 下 面 的 窗口 中 。， 

talk 的 用 户 可 以 以 任意 速度 和 任意 顺序 输入 字符 。talk 程序 就 必须 在 任何 时 刻 都 准备 
好 从 任 一 数据 源 接收 字符 ,而 不 像 其 他 的 程序 可 以 依靠 明确 的 协议 。 服 务 器 等 待 着 read 或 
recvfrom 的 请 求 , 并 用 write 或 sendto 发 回 一 个 应 答 。 用 户 不 可 能 一 直 在 切换 自己 的 角色 
(输入 完 之 后 等 待 别人 的 应 答 ,然后 再 输入 ……) ,那么 talk 程序 如 何 解决 这 个 问题 呢 ? talk 
当然 也 不 能 这 样 做 ,如 下 述 代 码 : 


while(1)| 
read(fd kbd,$&c,1); /* read from keyboard x/ 
waddch(topwin,c); /* add to screen x/ 
write(fd sock,&c,1); /* send to other person x/ 
read(fd sock,&c,1); /* read from other person x/ 


waddch(botwin,c) ; /* add to screen x/ 
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按照 上 述 代码 的 逻辑 ,如 果 对 方 一 直 在 输入 信息 ,而 你 却 一 直 在 看 他 发 的 消息 ,自己 没 
有 输入 过 , 那 结 果 会 怎么 样 呢 ? 程序 在 第 一 个 read 调用 的 时 候 就 挂 起 了 ,并 不 会 从 你 的 对 方 
那里 读 取 数据 。 上 面 的 方法 只 有 在 用 户 不 断 切换 自己 角色 的 时 候 才 可 以 正常 工作 。 

这 里 通过 调用 fcntl 函数 将 文件 描述 符 设置 为 O_NONBLOCK 标志 从 而 使 文件 描述 符 
变 成 非 阻 塞 模式 。 使 用 非 阻 塞 模式 使 得 对 于 read 的 调用 立即 返回 。 这 个 时 候 , 如 果 并 没有 
字符 可 以 读 取 ,read 调用 返回 零 。 虽 然 非 阻塞 的 方式 可 以 工作 ,但 是 它 占 用 了 太 多 的 处 理 器 
时 人 间 。 由 于 每 次 调用 read 都 是 一 个 系统 调用 ,程序 就 必须 回 到 内 核 模式 工作 。 这 样 在 等 待 
一 个 字符 到 来 之 前 系统 可 能 会 切换 上 于 次 。 


15.2.2 select 系统 调用 


Unix 系统 提供 了 系统 调用 select, 它 允许 程序 挂 起 ,并 等 待 从 不 止 一 个 文件 描述 符 的 输 
人。 它 的 原理 很 简单 : 

OD 获得 所 需要 的 文件 描述 符 列表 s 

(2) 将 此 列表 传 给 select; | 

(3) select 挂 起 直到 任何 一 个 文件 描述 符 有 数据 到 达 ; 

(4) select 设置 一 个 变量 中 的 者 干 位 ,用 来 通知 你 哪 一 个 文件 描述 符 已 经 有 输入 的 数据 。 

下 面 的 程序 selectdemo. c 等 待 两 个 设备 上 数据 到 达 ， 


/* selectdemo.c . watch for input on two devices AND timeout 


x usage. selectdemo devi dev2 timeout 

x action; reports on input from each file, and 
x reports timeouts 

x*/ 


# include <stdio.h> 

# include <(sys/time. h> 
f include <sys/types.h> 
# include <unistd.h> 

# include <fentl. h> 


# define oops(m,x) { perror(m); exit(x); } 


main(int ac, char x av[ |) 


/ 
1 


int fdl, fd2; /* the fds to watch x/ 
Struct timeval timeout; /* how long to wait */ 
fd_set readfds; /* watch these for input */ 
int maxfd; /* max fd plus 1 «/ 

int retval; /* return from select x/ 


if (Cac t= 4 )§ 


fprintf(stderr, "usage: %s file file timeout", x av); 





j 
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exit(1); 


/** open files x x/ 


if ( (fdl = open(av[1],O RDONLY)) == -1) 
oops(av[ 1], 2); 
if ( (fd2 = open(av[2],0 RDONLY)) == -1) 


oops(av[ 2], 3); 
maxfd = 1 + (fdi>fd2? fdl :fd2) ， 


while(1) | 
/* * make a list of file descriptors to watch x x/ 
FD ZERO(&readfds); /x clear all bits x/ 
FD SET(fdl, &readfds); /x set bit for fdl x/ 
FD SET(fd2, &readfds); /x set bit for fd2 x/ 


/* * set timeout value x x/ 
timeout.tv sec = atoi(av[3]; /* set seconds x/ 


timeout.tv usec = 0; /* no useconds x/ 


f 


/* * wait for input x x/ 
retval = select(maxfd,&readfds, NULL, NULL, &timeout) ; 
if ( retval == -1) 
oops( "select", 4); 
if ( retval > 0 ){ 
/* * check bits for each fd x x/ 
if ( FD ISSET(fd1, &readfds) ) 
showdata(av[1], fd1); 
if ( FD ISSET(fd2, &readfds) ) 
showdata(av|2], fd2); 
j 


else 


printf("no input after %d seconds\n", atoi(av[3])); 


F 


showdata(char x fname, int fd) 


{ 


char buf[ BUFSIZ ]; 


int n; 


printf("%s; ", fname, n); 
fflush(stdout); 
n = read(fd, buf, BUFSIZ) ; 
if (n == -1) 


467 





LM s dn 








. 468 * Unix/Linux 编程 实践 教程 


oops(fname,5); 
write(1, buf, n); 
write(1, "An", 1); 
j 


上 面 的 代码 遵循 了 前 面 所 列 出 的 四 步 。 文 件 描 述 符 列表 以 二 进 制 位 方式 存储 在 fd. set 
类 型 的 变量 中 。 宏 FD_ ZERO,FD SET #1 FD_ISSET 先 将 fd_set 中 所 有 位 清除 ,然后 为 基 
文件 描述 符 设 置 一 位 ,再 对 该 位 进行 监听 。 和 希望 同时 对 两 个 文件 描述 符 监听 ,因此 调用 了 两 
次 FD SET, 

select 调用 同时 也 接受 对 于 超时 的 处 理 。 如 果 在 指定 的 时 间 内 ,没有 数据 到 达 ,select 将 
直接 返回 。 在 selectdemo. c 中 ,在 命令 行 接收 一 个 字符 串 作 为 超时 的 时 间 值 。 用 下 面 的 代 
码 对 程序 进行 测试 : 


$ cc selectdemo.c - o selectdemo 

$ ./selectdemo /dev/tty /dev/mouse 10 
hello 

/dev/tty; hello 


no input after 4 seconds 
no input after 4 seconds 
testing | 
/dev/tty; testing 

我 移动 了 鼠标 
/dev/mouse: ( 
/dev/mouse. 


/dev/mouse, y 


这 个 例子 展示 了 程序 如 何等 待 键盘 或 鼠标 输入 的 到 来 。 当 然 大 家 可 以 设计 更 加 有 意思 
的 程序 ,不 只 是 将 输入 打印 出 来 ,并且 对 输入 进行 特定 的 处 理 。 





select 调用 小 结 如 下 。 
select 
目标 同步 的 L/O f FH 
头 文 件 # include <sys/time. h> 
函数 原型 int = select (int numfds, 


fd_set * read_set, 

fd set x write set, 

Íd set * error set, 

struct timeval * timeout) ; 
void FD ZERO(fd set * fdset) 
void FD_SETCint fd, fd set x fdset) 
void FD CLR(int fd, fd set x fdset) 
void FD ISSET(int fd, fd set x fdset) 


eee 
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续 表 





Select 


参数 numfds 需要 监听 的 最 大 fd 值 加 1 
read set 等 待 从 此 集合 包括 的 文件 描述 符 到 来 的 数据 
write_set 等 待 向 这 些 文件 描述 符 写 数据 的 许可 
error set 等 待 这 些 文件 描述 符 操作 的 异常 


timeout 超过 此 时 间 后 函数 返回 
返回 值 —1 发 生 错 误 
0 超时 | 
num 满足 需求 的 文件 描述 符 的 数目 


select 同时 监视 多 个 文件 描述 符 。 在 指定 情况 发 生 的 时 候 , 图 数 返回 。 详 细 一 点 说 ， 
select 监听 在 三 组 文件 描述 符 上 发 生 的 事件 : 检查 第 一 组 是 否 可 以 读 取 ,检查 第 二 组 是 否 可 
以 写 入 ,检查 第 三 组 是 否 有 异常 发 生 。 每 一 组 的 文件 描述 符 被 记录 到 一 个 二 进 制 位 的 数组 
中 。 这 里 的 numfds 恰好 等 于 需要 监听 的 最 大 的 文件 描述 符 加 1 。 

当 参 数 指定 的 条 件 被 满足 或 超时 的 时 候 ,select 函数 返回 。 若 指定 的 条 件 被 满足 ,select 
返回 满足 条 件 的 文件 描述 符 的 数目 。 

右 任 一 参数 为 null, select 将 忽略 此 参数 。 


15.2.3 select 与 talk 


本 章 并 不 打算 把 talk 的 程序 写 出 来 ,因为 关于 定位 其 他 的 用 户 和 建立 连接 还 有 很 多 步 
又 要 做 ,比如 说 : 定位 对 方 用户 就 需要 搜寻 utmp 文件 。 大 家 已 经 学 习 过 实现 其 他 所 有 步骤 
所 需 的 知识 和 技巧 了 。 其 他 还 有 哪些 步骤 呢 ? 它们 需要 娜 些 系统 调用 ? 这 两 个 问题 就 留 给 
大 家 回答 了 。 


15.2.4 select 5j poll 


也 可 以 使 用 poll 调用 来 代替 select 的 功能 。select 是 由 Berkeley 研制 出 来 的 ,而 poll W 
是 贝尔 实验 室 的 成 果 。 这 两 者 完成 类 似 的 功能 ,而 现代 的 大 部 分 的 Unix 版 本 对 于 两 者 都 
支持 。 


15.3 通信 的 选择 


talk 命令 是 Unix 系统 程序 的 一 个 很 好 的 例子 , 它 很 好 地 体现 了 进程 间 如 何 进行 通信 和 和 
分 工 合 作 。talk 中 的 两 个 进程 读 写 消息 ,就 好 像 消息 是 被 存储 在 常规 的 磁盘 上 一 样 。 

talk 中 的 文件 描述 符 分 别 对 应 了 键盘 、 屏 幕 和 socket( 如 图 15. 3 所 示 ), 但 它们 仍然 可 以 
被 连接 到 其 他 进程 或 其 他 设备 上 去 。talk 程序 中 的 进程 间 数 据 传输 与 进程 间 的 操作 都 是 极 
为 重要 的 部 分 。 要 知道 选择 一 个 好 的 通信 方式 和 选择 正确 的 算法 或 数据 结构 一 样 的 重要 。 
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读 写 文件 描述 符 





图 15.3 三 个 文件 描述 符 


15.3.1 一 个 问题 的 三 种 解决 方案 


问题 : 分 服务 器 得 到 数据 ,将 其 传 给 客户 端 ,如 何 来 决定 选择 哪 一 种 通信 方法 呢 ? 起 一 
想 前 面 使 用 流 socket 写 过 的 时 间 / 日 期 服务 器 、 茶 一 进程 知道 当前 的 时 间 , 而 另 一 进程 想 获 
取 时 间 信 息 ( 如 图 15.4 所 示 ) ;如何 让 一 个 进程 从 另 二 个 进程 得 到 数据 呢 ? 


客户 端 服务 器 





图 15. 4 茶 进 程 拥 有 另 一 进程 所 要 获得 的 信息 


三 种 解决 方案 : 文件 .管道 .共享 内 存 。 图 15 5 展示 了 三 种 不 同 的 方法 : 一 种 是 已 经 学 习 
过 的 ,但 另外 的 两 种 方法 却 是 新 的 。 大 家 所 熟悉 的 方案 是 使 用 文件 ,而 另外 的 两 种 新 方案 是 合 
名 管道 (named plpe) 及 共享 内 存 段 (share memory segment) $E W , 这 些 方法 分 别 通过 磁盘 内核 
“全 用户 室 间 进行 数据 的 传输 。 那 么 每 种 方法 具体 如 何 应 用 ? 各 有 和 何 优 缺点 呢 ? | 






两 个 进程 拥有 指 
向 同一 个 共享 内 
存 段 的 指针 


”通过 读 写 同一 个 
从 管道 传递 数据 | Ce 文件 来 共享 数据 
图 15.5， 三 种 传输 数据 的 方法 


15.3.2 通过 文件 的 进程 间 通 信 


进程 间 可 以 通过 文件 来 进行 通信 ， 茶 进程 将 数据 写 信 文件 , 别 的 进程 再 将 数据 从 文件 
中 读 出 。 

(1) 使 用 文件 进行 通信 的 时 间 / 日 期 服务 器 

这 里 不 必 写 一 个 完整 的 C 程序 ,下 面 的 一 个 shell 脚本 就 可 以 完成 任务 了 


#1 /bin/sh 


# time server — file version 
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while true ; do 
date > /temp/current date 
sleep 1 


done 


此 服务 大 每 隔 1 PP PECES BU HORSE TB) A ACC (E HRS fr BE E I8] EI OTK 
件 内 容 删 除 然后 重 写 。 

(2) 使 用 文件 进行 通信 的 时 间 / 日 期 客户 器 

客户 端 读 取 文 件 的 内 容 : 


#1 /bin/sh 
# time client - file version 


cat /tmp/current date 


(3) 使 用 文件 的 IPC 小 结 

访问 控制 : 客户 端 必须 能 够 读 取 文件 。 通 过 使 用 标准 文件 访问 权限 ,可 以 给 予 服务 器 写 
权限 并 且 限 制 客 户 端 只 有 读 权 限 。 

多 客户 端 : 任意 数目 的 客户 可 以 同时 从 文件 中 读 取 数 据 。Unix 并 不 限制 同时 打开 同一 
文件 的 进程 数目 。 

SAY: 服务 器 通过 清空 内 容 再 重 写 的 方法 来 更 新 文件 。 如 果 某 客户 恰好 在 清空 和 
重 写 之 间 读 取 文 件 ,那么 它 得 到 的 将 是 一 个 空 的 或 只 有 部 分 的 内 容 。 

避免 欧 态 条 件 : 服务 器 和 客户 端 可 以 使 用 某 种 类 型 的 互 斥 量 来 避免 竟 态 条 件 。 后 面 的 
章节 中 大 家 将 会 学 到 文件 锁 的 方法 。 万 外 ,如 果 服 务 器 在 程序 中 使 用 lseek 和 write 函数 来 
替换 create, 这 样 文件 永远 都 不 可 能 为 空 ,因为 write 是 一 个 原子 操作 , 它 不 会 在 执行 中 被 
TS. 


15.3.3 命名 管道 


通常 的 管道 只 能 连接 相关 的 进程 。 常 规 管道 由 进程 创建 ,并 由 最 后 一 个 进程 关闭 

使 用 命名 管道 可 以 连接 不 相关 的 进程 ,并 且 可 以 独立 于 进程 存在 (如 图 15. 6 R). 称 
这 样 的 命名 管道 为 FIFO( 先 进 先 出 队列 )。FIFO 类 似 于 放 在 草坪 上 的 一 段 给 花园 浇 水 的 水 
管 。 任何 人 都 可 以 将 此 水 管 的 一 端 放 在 自己 的 耳 杂 边 ,而 另 一 个 人 通过 水 管 向 对 方 说 话 。 
人 们 可 以 通过 此 水 管 进行 交流 ,而 在 没有 人 使 用 的 时 候 , 水 管 仍然 是 存在 的 。FIFO 可 以 看 
作 由 文件 名 标志 的 一 根 水 管 。 








| pipe ( ) mkfifo ( ) 
图 15.6 FIFO 与 进程 独立 
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1. 使 用 FIFO 

C1) 如 何 创建 FIFO? 

FE PRA mkfifo(char * name, mode t mode) 使 用 指定 的 权限 模式 来 创建 FIFO, mkfifo 
命令 通常 调用 这 个 函数 。 

(2) 如 何 删除 FIFO? 

类 似 于 删除 文件 ,unlink(fifoname) 所 数 可 以 用 来 删除 FIFO, 

(3) 如 何 监 听 FIFO 的 连接 ? 

使 用 openCfifoname, O RDONL YO Bj. open 函数 阻塞 进程 直到 菜 一 进程 打开 FIFO 
进行 写 操 作 。 

(4) 如 何 通 过 FIFO 开始 会 话 ? 

使 用 open(fifoname,O. WRONL Y) 函数 。 此 时 open 函数 阻塞 进程 直到 某 一 进程 打开 
FIFO 进行 读 取 操作 。 

CS) 两 进程 如 何 通过 FIFO 进行 通信 ? 

发 送 进程 用 write 调用 ,而 监听 进程 使 用 read 调用 。 写 进程 调用 close 来 通知 读 进 程 通 
fi ZAR 

下 面 两 个 shel 脚本 是 基于 FIFO 的 时 间 / 日 期 服务 的 服务 器 和 客户 端 程序 ; 


i! /bin/sh 
+ time server 
while true ; do 
rm — f /tmp/time fifo 
mkfifo /tmp/time fifo 
date — /tmp/time fifo 


done 
#1 /bin/sh 


f time client 


cat /tmp/time fifo 


2. FIFO 类 型 的 IPC 小 结 | 

访问 : FIFO 使 用 与 通常 文件 相同 的 文件 访问 。 服 务 器 有 写 权限 ,而 客户 端 只 限于 读 
权限 。 

多 个 客户 端 : 命名 管道 是 一 个 队列 而 不 是 常规 文件 。 写 者 将 字 节 写 人 队列 ,而 读者 从 队 
列 头 部 移出 宇 节 。 每 个 客户 端 都 会 将 时 间 / 日 期 的 数据 移出 队列 ,因此 服务 器 必须 重 写 数 据 。 

EERIE: FIFO 版 本 的 时 间 / 日 期 服务 器 程序 完全 不 存在 竞 态 条 件 问题 。 在 信息 的 长 
度 不 超过 管道 的 容量 的 情况 下 ,read 和 write 系统 调用 只 是 原子 操作 。 读 取 操 作 将 管道 清空 
而 号 人 操作 又 将 管道 塞 满 。 在 读者 和 写 者 连通 之 前 ,系统 内 核 将 进程 挂 起 。 因 此 锁 机 制 在 
这 里 并 不 需要 。 

时 间 / 日 期 服务 器 将 数据 写 人 FIFO 后 ,将 自己 挂 起 直到 客户 端 打开 FIFO 来 读 取 数 据 。 
在 某 些 应 用 程序 中 ,服务 器 从 FIFO 中 读 取 数据 ,然后 等 待 客户 端 把 数据 写 入 。 大 家 想 想 看 
有 没有 服务 器 等 待 客户 端 输入 的 例子 ? 
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15.3.4 共享 内 存 

字 节 流 是 如 何 通 过 文件 或 FIFO 来 传输 的 ? write 将 数据 从 内 存 复 制 到 内 核 缓存 中 。 
read 将 数据 从 内 核 缓 存 复 制 到 内 存 中 。 

如 果 进 程 运行 在 用 户 空间 的 不 同 部 分 ,进程 间 是 如 何 将 数据 从 内 核 缓 存 中 复制 进 复制 
出 的 呢 ?” 同 一 个 系统 里 的 两 个 进程 通过 使 用 共享 的 内 存 段 来 交换 数据 。 共 享 的 内 存 段 是 用 
户 内 存 的 一 部 分 。 每 一 个 进程 都 有 一 个 指向 此 内 存 段 的 指针 (如 图 15.7 所 示 )。 依 靠 访 问 权 
限 的 设置 ,所 有 进程 都 可 以 读 取 这 一 块 空间 中 的 数据 。 因 此 进程 间 的 资源 是 共享 的 ,而 不 是 
被 复制 来 复制 去 的 。 共 享 内 存 段 对 于 进程 而 言 ,就 类 似 于 共享 变量 对 于 线程 一 样 。 
共享 内 存 可 以 
允许 一 个 进程 
直接 将 数据 放 
入 另 一 个 进程 
的 内 存 空间 中 





使 用 管道 需要 两 
次 复制 数据 


图 15.7 两 个 进程 共享 一 块 内 存 区 域 


l. 共享 内 存 段 的 一 些 基 本 概念 
。 共享 内 存 段 在 内 存 中 不 依赖 于 进程 的 存在 而 存在 。 
共享 内 存 段 有 自己 的 名 字 , 称 为 关键 字 (key)。 
。 关键 字 是 一 个 整 型 数 .。 
共享 内 存 段 有 自己 的 拥有 者 以 及 权限 位 。 
进程 可 以 连接 到 某 共享 内 存 段 ,并 且 获 得 指向 此 段 的 指针 。 
2. 使 用 共享 内 存 段 
(1) 如 何 得 到 共享 内 存 段 ? 
int seg id = shmget(key, size -of- segment, flags) 
如 果 内 存 段 存在 ,函数 shmget 找到 它 的 位 置 。 如 果 不 存在 ,可 以 通过 在 flags 值 中 指定 
一 个 创建 此 段 和 初始 化 权限 模式 的 请 求 。 
(2) 如 何 将 进程 连接 到 某 个 共享 内 存 段 ? 
void ptr = * shmat(seg id, NULL, flags) 
shmat 在 进程 的 地 址 空间 中 创建 共享 内 存 段 的 部 分 ,并 返回 一 个 指向 此 段 的 指针 。flags 
参数 用 来 指定 此 内 存 段 是 否 为 只 读 。 
(3) 如 何 与 共享 内 存 段 进行 读 写 交互 ? 
strcpy(ptr, "hello") ; 
memcpy() 、ptr[i] 及 其 他 一 些 通 用 的 指针 操作 。 
3. 使 用 共享 内 存 段 的 时 间 / 日 期 服务 器 


/* shm ts.c ; the time server using shared memory, a bizarre application x/ 
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# include <stdio.h> 
4+ include  «sys/shm. h> 
# include «time. h> 


# define TIME MEM KEY 99 /* like a filename */ 
f define SEG SIZE ((size t)100) /* size of segment x/ 


H define oops(m,x) { perror(m); exit(x); } 


main() 

{ 
int seg_id; 
char  xmem ptr, x ctime(); 
long now; 


int n: 


/* create a shared memory segment x/ 


seg id = shmget( TIME MEM KEY, SEG SIZE, IPC CREAT|0777 ); 
if ( seg id == -1) 
oops("shmget", 1); 


/* attach to it and get a pointer to where it attaches x/ 


mem ptr = shmat( seg id, NULL, 0); 
if ( mem ptr == ( void x) -1) 
oops("shmat", 2); 


/* run for a minute x/ 
for (n=0; n« 60; ntt Jd 
time( &now ); /x get the time x/ 


Strcpy(mem ptr, ctime(&now)) /* write to mem x/ 


LJ 
F 


sleep(1); /x wait a sec x/ 


/* now remove it x/ 


shmctl( seg id, IPC RMID, NULL ); 


4. 使 用 共享 内 存 段 的 时 间 / 日 期 客户 端 


/* shm tc.c : the time client using shared memory, a bizarre application */ 


# include <«<stdio. h> 
# include <«<sys/shm. h> 
# include <time. h> 


# define TIME MEM KEY 99 /* kind of like a port number «/ 
itdefine SEG SIZE ((size t)100) /* size of segment x/ 


# define oops(m,x) { perror(m); exit(x); ) 
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main() 
{ 
int seg_id; 
char *mem_ptr, * ctime(); 


long now; 
/* create a shared memory segment x/ 
seg id = shmget( TIME MEM KEY, SEG SIZE, 0777 ) ， 
if( seg id == -1) 
oops("shmget",1); 
/* attach to it and get a pointer to where it attaches x/ 
mem ptr = shmat( seg id, NULL, 0 ); 
if ( mem ptr == ( void *) -1) 
oops("shmat",2); 
printf("The time, direct from memory, .. $ s", mem ptr); 


shmdt( mem ptr ); /* detach, but not needed here x/ 
} 


9. 共享 内 存 段 类 型 的 IPC 小 结 

Uil: 客户 端 必 须 有 对 共享 内 存 段 的 读 权 限 。 共 享 内 存 段 拥有 一 个 权限 系统 , 它 的 工作 
原理 和 文件 权限 系统 类 似 。 共 享 内 存 段 有 自己 的 拥有 者 并 且 为 用 户 、 组 或 其 他 成 员 设 置 了 
权限 位 ,来 控制 他 们 各 自 的 访问 权限 。 正 因为 有 如 此 特性 , 才 可 以 让 服务 器 只 有 写 权 限 而 客 
PR RB. 

多 个 客户 : 任意 数目 的 客户 都 可 以 同时 从 共享 内 存 段 读数 据 。 

竞 态 条 件 : 服务 器 通过 调用 一 个 运行 在 用 户 空间 的 库 函 数 strcpy 来 更 新 共享 的 内 存 段 。 
如 有 果 客 户 端正 好 在 服务 器 向 内 存 段 中 写 人 新 数据 的 时 候 来 访问 内 存 段 ,那么 它 可 能 既 读 到 
新 数据 也 读 到 老 数据 。 

避免 竞 态 条 件 : 服务 器 和 客户 段 必须 使 用 相同 的 系统 来 对 资源 加 锁 。 内 核 提供 了 一 种 
进程 间 加 锁 的 机 制 , 称 为 信和 号 量 机 制 。 在 下 一 节 中 将 会 学 习 这 种 机 制 。 


15.3.5 各 种 进程 间 通 信 方 法 的 比较 


最 初 的 问题 是 如 何 使 一 个 进程 从 另 一 个 进程 得 到 字符 串 。 前 面 提 到 的 三 个 方法 都 可 以 
达到 要 求 。 客 户 端 从 服务 器 端 得 到 它们 想 要 的 数据 。 前 面 已 经 介绍 了 四 个 版 本 的 客户 / 服 
务 器 系统 ,甚至 还 可 以 写 出 使 用 数据 报 或 Unix 域 地 址 的 新 版 本 。 不 过 如 何 决定 到 底 用 哪 一 
种 方法 来 实现 呢 ? 有 什么 选择 标准 吗 ? 

(1) 速度 

通过 文件 或 命名 管道 来 传输 数据 需要 更 多 的 操作 。 系 统 内 核 将 数据 复制 到 内 核 空间 
中 ,然后 再 切换 回 用 户 空间 。 对 于 利用 文件 进行 传输 来 说 ,内 核 将 数据 复制 到 磁盘 上 ,然后 
将 数据 再 从 磁盘 上 复制 出 去 。 实 际 上 ,在 存储 器 中 存储 数据 比 想象 中 要 复杂 的 多 。 虚 拟 内 
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存 系统 允许 用 户 空间 中 的 段 交换 到 磁盘 上 ,因此 就 是 共享 内 存 段 机 制 同样 也 包括 了 对 磁盘 
的 读 写 操作 。 

(2) 连接 和 无 连接 

文件 和 共享 内 存 段 就 像 公告 牌 一 样 。 数 据 产 生 者 将 信息 贴 在 公告 牌 上 ,多 个 消费 者 可 
以 同时 从 公告 牌 上 阅读 信息 。FIFO 要 求 建立 连接 ,因为 在 内 核 转 换 数 据 之 前 ,读者 和 写 者 
都 必须 等 待 着 FIFO 被 打开 ,并 且 也 只 有 一 个 客户 可 以 阅读 此 消息 。 流 socket 是 面向 连接 
的 ,而 数据 报 socket 则 不 是 。 在 某 些 应 用 程序 中 ,这 些 区 别 起 着 关键 性 的 作用 。 

(3) 范围 

你 希望 程序 中 的 消息 能 传送 多 远 的 距离 呢 ? 共享 内 存 和 命名 管道 只 允许 本 机 上 的 进程 
之 间 通 信 。 通 过 文件 进行 传输 可 以 允许 不 同 机 器 上 的 进程 进行 通信 。 使 用 IP 地 址 的 socket 
可 以 与 不 同 机 器 上 的 进程 进行 通信 ,而 使 用 Unix 地 址 的 socket 却 不 能 。 这 样 ,使 用 哪 一 种 
方法 进行 通信 和 就 取决 于 通信 实体 间 的 距离 了 。 

C4) 访问 限制 

你 是 希望 所 有 人 都 能 与 服务 器 通信 还 是 只 有 特定 权限 的 用 户 才 行 ? 文件 .FIFO、 共 享 内 
存 以 及 Unix 地 址 socket 都 提供 标准 的 Unix 文件 系统 权限 。 而 Internet socket 则 不 行 。 

(5) 竞 态 条 件 

使 用 共享 内 存 和 共享 文件 要 比 使 用 管道 和 socket 麻烦 。 管 道 和 socket 是 由 内 核 来 管理 
的 队列 。 写 者 将 数据 放 进 一 端 ,而 读者 则 从 另 一 端 将 数据 读 出 ,进程 并 不 需要 考虑 其 内 部 
结构 。 | 

然而 对 于 共享 文件 和 共享 内 存 的 访问 却 不 是 由 内 核 进行 管理 的 。 如 果 某 进程 在 读 文 件 
的 过 程 中 , 男 一 个 进程 正在 对 文件 进行 重 写 , 读 进程 读 到 的 很 可 能 就 是 不 完整 或 不 一 致 的 数 
据 。 下 一 节 将 会 介绍 文件 锁 和 信号 量 的 应 用 。 


15.4 进程 之 间 的 分 工 合作 


如 何 处 理 这 些 令 人 恼火 的 竞 态 条 件 呢 ? 客户 和 服务 器 若 通过 共享 文件 或 内 存 的 方式 来 
进行 通信 ,又 如 何 来 保证 它们 正常 运行 而 不 出 现 冲 突 呢 ? 它们 如 何 分 工 合作 ? 本 节 将 介绍 
进程 在 访问 共享 资源 时 所 使 用 的 技术 : 文件 锁 和 信和 号 量 。 


15.4.1 文件 锁 


1, 两 种 类 型 的 锁 

考虑 两 种 类 型 的 问题 。 首 先 , 当 客 户 试 图 读 取 文件 时 ,服务 器 正在 重 写 文件 ,结果 会 如 
何 呢 ? 客户 读 出 来 的 可 能 就 是 不 完整 的 数据 。 上面 所 提 到 的 日 期 /时 间 服 务 器 不 太 可 能 遇 
到 这 个 问题 ,因为 其 消息 比较 短 , 重 写 时 间 较 少 。 但 如 果 是 天 气 预 报 服务 器 ,其 交互 的 消息 
比较 长 ,就 有 可 能 遇 到 竞 态 问 题 。 因 此 , 当 服 务 器 在 重 写 文 件 的 时 候 , 客 户 必 须 等 待 服 务 器 
完成 之 后 才能 开始 读 。 

再 考虑 一 下 正好 相反 的 情况 。 当 客户 正在 一 行 一 行 读 数据 的 时 候 , 服 务 器 突然 把 文件 
抢 过 来 ,将 内 容 删 除 , 然 后 开始 重 写 数据 。 客 户 端 看 着 文件 从 自己 眼皮 底下 被 抢 过 去 而 无 能 








15 Et 进程 间 通 信 (IPC) © 477 » 


为 力 。 因 此 , 当 客 户 在 读 取 文件 的 时 候 , 服 务 器 也 必须 等 待 客 户 完 成 。 其 他 的 客户 不 必 去 
等 ,因为 多 个 进程 一 起 读 文件 不 会 带 来 任何 风险 。 

为 了 避免 这 些 问 题 , 需 要 两 种 类 型 的 锁 。 第 一 种 类 型 为 写 数 据 锁 , 它 告 诉 其 他 进程 我 
在 写 文 件 , 在 完成 之 前 任何 人 都 必须 等 待 。 第 二 种 类 型 的 锁 为 读数 据 锁 , 它 告诉 其 他 进程 : 
“我 在 读 文件 ,要 写 文件 必须 等 我 完成 ,要 读 文件 的 不 受 影响 。” 

2. 使 用 文件 锁 进 行 编程 

Unix 提供 了 3 种 方法 锁 住 打开 的 文件 : flock lockf 和 fcntl。 三 者 中 最 灵活 和 移植 性 最 
好 的 应 该 是 fentl, 

下 面 使 用 fcntl 锁 文 件 。 

C1) 如 何 给 已 经 打开 的 文件 加 读数 据 锁 

使 用 fcntl(fd,F SETLKW, glockinfo) 

第 一 个 参数 是 该 文件 对 应 的 文件 描述 符 。 第 二 个 参数 F_SETI.KW 说 明 若 必要 的 话 ,可 
以 等 待 其 他 的 进程 释放 锁 。 第 三 个 参数 指向 一 个 struct flock 类 型 的 变量 。 下 列 代码 为 一 个 
文件 描述 符 设 置 读数 据 锁 ，; 


set read lock(int fd) 
( 


struct flock lockinfo; 


lockinfo.i type - F RDLCK; /x a read lock on a region x/ 
lockinfo.l pid = getpidO; /* for ME x/ 

lockinfo.l start = 0; /* starting 0 bytes from.. x/ 
lockinfo.l whence = SEEK SET; /* start of file x/ 

lockinfo.] len = 0; /* extending until EOF «/ 


fentl(fd,F SETLKW,&lockinfo); 
j 


(2) 如 何在 打开 的 文件 上 加 写 数 据 锁 

使 用 fcntl(fd,F SETLKW, Eai), 并 将 lockinfo.1 type € F WRLCK, 

(3) 怎样 解锁 ? 

使 用 fcntl(fd,F_SETLKW, 必 lockinfo) ,并 将 lockinfo.l type 置 F UNLCK, 

(4) 如 何 只 锁 住 文件 的 一 部 分 ? | 

使 用 fcntl(fd, F_SETLKW, &lockinfo) ,并 将 lockinfo. | start 置 为 开始 位 置 的 偏 移 量 ， 
同时 将 lockinfo. 1l. len 置 为 区 域 的 长 度 。 

3. 基于 文件 的 时 间 服 务 器 代码 


/* file ts.c — read the current date/time from a file 
x usage: file ts filename 
* action; writes the current time/date to filename 
x note; uses fentl() - based locking 
x/ 


# include <stdio.h> 
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i include <csys/file. h> 
# include <fentl. h> 
# include < time. h> 


# define oops(m,x) { perror(m); exit(x); } 


main(int ac, char * av[ ]) 


1 


int fd; 
time t now; 


char * message; 


if (ac 1= 2 ){ 
fprintf(stderr, "usage: file ts filename\n"); 
exit(1); 
j 
if ( (fd = open(av[1],O CREAT|O TRUNC|O WRONLY,0644)) == -1) 


oops(av[1],2); 


while(1) 
( 
time(&now); 
message - ctime(&now); /* compute time x/ 
lock operation(fd, F WRLCK); /* lock for writing */ 
if ( lseek(fd, OL, SEEK SET) == 一 1 ) 
oops("lseek",3); 
if ( write(fd, message, strlen(message)) == -1) 


oops( "write", 4); 


lock operation(fd, F UNLCK); /* unlock file x/ 


sleep(1); /* wait for new time */ 


lock operation(int fd, int op) 


{ 


struct flock lock; 


lock. 1 whence = SEEK SET; 
lock. 1 start = lock.l len = 0; 
lock. 1_pid = getpid(); 

lock.l type = op; 


if ( fcntl(fd, F SETLKW, &lock) == -1) 


oops("lock operation", 6); 








第 15 章 进程 间 通 信 (IPC) « 479 


4， 基 于 文件 的 时 间 服 务 客户 端 代码 


/* file tc.c - read the current date/time from a file 


x usage; file tc filename 
x uses; fcntl() - based locking 
x/ 


# include <(stdio. h> 
# include <(sys/file. h> 
# include <(fentl. h> 


# define oops(m,x) ( perror(m); exit(x); } 
# define BUFLEN 10 


main(int ac, char * av[ p 


{ 


int fd, nread; 
char buf[ BUFLEN] ; 


if Cac f= 2 ){ 
fprintf(stderr, "usage; file tc filename\n"); 


exit(1); 


if ( (fd? open(av[1],0 RDONLY)) == -1) 
oops(av[1],3); 


lock operation(fd, F RDLCK); 


while( (nread = read(fd, buf, BUFLEN)) > 0 ) 


write(l, buf, nread ); 
lock operation(fd, F UNLCK); 


close(fd) ; 


lock operation(int fd, int op) 


1 
struct flock lock; 


lock.l whence - SEEK SET; 
lock.l start = lock.l len = 0; 


lock.l pid = getpidO; 
lock.l type - op; 


if ( fentl(fd, F SETLKW, &lock) == -1) 


oops("lock operation", 6); 
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5. 文件 锁 ; 小 结 

使 用 F_SETLKW 参数 调用 fcntl 可 以 使 进程 挂 起 直到 内 核 允许 进程 设置 指定 的 锁 。 在 
读 取 数 据 之 前 ,客户 必须 设置 读 取 数 据 的 锁 。 若 服务 器 对 文件 加 写 数 据 锁 , 客 户 只 好 等 待 服 
务 器 完成 。 服 务 器 在 重 写 数据 之 前 ,也 必须 对 文件 加 写 数 据 锁 ,如 果 这 时 客户 加 了 一 个 读数 
据 的 锁 , 那 服务 器 会 被 挂 起 直到 所 有 客户 释放 这 个 锁 。 

6. 重要 细节 : ED ua 

在 前 面 对 于 文件 锁 的 讨论 中 ,不 管 客户 还 是 服务 器 在 读 或 修改 文件 的 时 候 ,程序 都 是 自 
觉 有 序 地 等 待 ,设置 及 释放 文件 锁 。 那 么 当 别 的 进程 设置 了 锁 的 时 候 , 其 他 进程 是 否 可 以 忽 
略 它 ,仍旧 继续 原来 的 读 取 或 是 修改 操作 吗 ? 答案 是 肯定 的 。Unix 的 锁 机 制 允许 进程 通过 
这 种 方式 合作 ,但 并 不 强迫 它们 一 定 要 用 。 | 


15.4.2 信号 量 (Semaphores ) 


在 基于 共享 内 存 段 技术 的 时 间 / 日 期 系统 中 ,共享 内 存 段 的 作用 与 基于 文件 系统 的 时 间 
/日 期 系统 中 的 文件 是 相同 的 。 前 面 介 绍 了 用 锁 的 机 制 来 解决 访问 文件 的 冲突 ,共享 内 存 段 
如 何 来 避免 数据 冲突 呢 ? 在 共享 内 存 段 中 是 否 也 存在 着 读数 据 锁 和 写 数 据 锁 的 概念 ? 不 
是 ,但 进程 使 用 一 个 更 加 灵活 的 机 制 来 合作 : fim RE. 

信 坊 量 是 一 个 内 核 变 量 , 它 可 以 被 系统 中 的 任何 进程 所 访问 。 进 程 间 可 以 使 用 这 个 变 
量 来 协调 对 于 共享 内 存 和 其 他 资源 的 访问 。 上 一 章 讨论 了 如 何在 特定 的 情况 发 生 时 使 用 条 
件 变 量 来 通知 其 他 线程 。 条 件 对 象 是 进程 中 的 全 局 变量 ,而 信号 量 则 是 系统 中 的 全 局 变量 。 

在 时 间 / 日 期 服务 器 和 客户 端 程序 中 ,如 何 来 使 用 信和 号 量 呢 ? 

l. 计数 器 及 其 操作 

在 无 客户 读 取 的 时 候 , 服 务 器 将 数据 写 人 共享 内 存 段 中 。 同 样 地 ,在 服务 器 没有 对 共享 
内 存 段 进行 写 操作 的 时 候 ,客户 可 以 读 取 数据 。 可 以 将 这 些 规 则 转换 为 关于 变量 值 的 表 
AR: 

。 客户 端 等 待 直到 number of writers == 0 

。 服务 器 等 待 直 到 number of readers == 0 

信和 号 量 是 系统 级 的 全 局 变量 ,这 里 可 以 使 用 两 个 信号 量 分 别 代表 读者 数 和 写 者 数 。 管 
理 者 写 变量 需要 两 个 操作 。 l 

举例 来 说 ,读者 必须 等 待 写 者 数 为 零 的 时 候 , 才 可 以 将 读者 数 加 1。 当 某 读者 读 完 数据 ， 
读者 数 必须 被 减 一 。 

同样 地 , 写 者 也 必须 等 待 读者 数 为 零 的 时 候 , 才 可 以 将 写 者 数 加 1。 等 待 读者 数 为 零 以 
及 将 写 者 数 加 1 是 两 个 独立 的 操作 ,必须 分 开 执 行 , 即 这 两 个 操作 都 是 原子 操作 。 通 过 使 用 
信号 量 来 通信 的 进程 可 以 使 用 若干 个 这 样 的 变量 ,并 且 独 立地 进行 这 些 原子 操作 。 

这 就 是 信号 量 机 制 的 工作 原理 。 进 程 可 以 同时 处 理 一 组 信号 量 上 的 多 个 操作 。 

2. 一 组 信号 量 、 多 个 活动 

时 间 服 务 器 系统 使 用 两 个 信和 号 量 ,如 图 15. 8 所 示 , 并 且 读 者 和 写 者 需 同时 对 两 个 活动 集 
进行 操作 。 
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“信号 量 集 





num rd num wrt 


图 15.8 信号 量 设置 : num readers,num writers 


在 修改 共享 内 存 之 前 ,服务 器 必须 先 对 这 组 活动 集 进行 操作 
。 [0] 等 候 num readers 变 成 0 

。 [1] 将 num writers 加 1 

当 服 务 器 完成 写 操作 之 后 ; 它 必须 再 对 下 面 这 组 活动 集 进行 操作 : 
* [0] 将 num writers 减 1 

在 客户 读 取 共享 内 存 之 前 ,必须 对 下 面 这 组 活动 集 进行 操作 : 
* [0] 等 待 num writers 变 成 0 

* [1] 将 num readers 加 1 

当 客户 完成 任务 之 后 ,需要 对 下 面 这 组 活动 集 进行 操作 

* [0] 将 num readers jx 1 

3. 服务 器 版 本 : shm ts2.c 

给 原来 的 程序 shm_ts. c 添加 信号 量 得 到 shm_ts2. c; 


/* shm ts2.c — time server shared mem ver2 ; use semaphores for locking 
* program uses shared memory with key 99 
* program uses semaphore set with key 9900 


*/ 


# include <stdio.h> 

# include <sys/shm. h> 

# include <time.h> 

# include <sys/types.h> 
# include <sys/sem.h> 

# include <signal.h> 


# define TIME MEM KEY 99 /* like a filename x/ 
# define TIME SEM KEY 9900 
# define SEG SIZE ((size t)100) /* size of segnent x/ 


#define oops(m,x) ( perror(m); exit(x); ) 


union semun ( int val ; struct semid ds * buf ; ushort x array; j; 
int seg id, semset id; /* global for cleanup() x/ 


void cleanup(int); 


e 481 。 








482 * Unix/Linux 编程 实践 教程 


main() 


1 


char x mem ptr, x ctime(); 
time t now; 


int n; 


/x create a shared memory segment «/ 





seg id = shmget( TIME MEM KEY, SEG SIZE, IPC_CREAT|0777 ); 


if ( seg id == -1) 
oops("shmget", 1); 


/* attach to it and get a pointer to where it attaches x/ 


mem ptr = shmat( seg id, NULL, 0 ); 
if (mem ptr == (void *) -1) 
oops("shmat", 2); 


/* create a semset; key 9900, 2 semaphores, and mode rw- rw- rw */ 


semset id - semget( TIME SEM KEY, 2, 
(0666|IPC CREAT|IPC EXCL) ); 
if ( semset id == -1) 


oops("semget", 3); 


set sem value( semset id, 0, 0); 


set sem value( semset id, 1, 0); 
Signal(SIGINT, cleanup); 


/* run for a minute x/ 
for (n=0; n«260; n++ ){ 
time( &now ) ; 
printf("\tshm ts2 waiting for lock\n"); 
wait and lock(semset id); 
printf("\tshm ts2 updating memory\n") ; 
strcpy (mem ptr, ctime(&now) ) ; 
sleep(5); 
release lock(semset id); 
printf("\tshm_ts2 released lock\n") ; 
sleep(1); 


cleanup(0) ; 


void cleanup(int n) 


{ 
shmctl( seg id, IPC RMID, NULL ); 


/* set counters */ 


/* both to zero x/ 


/* get the time x/ 
/* lock memory x/ 
/* write to mem x/ 
/* unlock x/ 


/x wait a sec x/ 


/* rm shrd mem x/ 
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semctl( semset id, 0, IPC RMID, NULL); /* rm sem set x/ 
} 


/x 
* initialize a semaphore 
*/ 

set sem value(int semset id, int semnum, int val) 


1 


union semun initval; 


initval.val - val; . 
if ( semctl(semset id, semnum, SETVAL, initval) == -1) 
. -. Ooops("semctl", 4); 
| 
jx 
* build and execute a 2- element action set, 
* wait for 0 on n readers AND increment n writers 
*/ 
wait and lock( int semset id) 


{ 


struct sembuf actions| 2]; /x action set «/ 
actions[0].sem_num = 0; /* sem[ 0] is n readers x/ 
actions[0].sem flg = SEM UNDO; /* auto cleanup x/ 
actions[0].sem op = 0; /* wait til no readers */ 
actions| 1]. sem num = 1; | /x sem 1] is n writers «/ 
actions[1].sem flg = SEM UNDO; /* auto cleanup */ 
actions[1].sem op = +1 ; /* incr num writers x/ 

if ( semop( semset id, actions, 2) == -1) 


oops("semop; locking", 10); 


} 
/* 


* build and execute a 1 - element action set, 
* decrement num writers 
*/ 

release lock( int semset id ) 


{ 、 


struct sembuf actions[1]; /* action set x/ 
actions[0].sem num = 1; /x sem[ 0] is n writerS x/ 
actions[0].sem_flg = SEM UNDO; /* auto cleanup «/ 
actions[0].sem op = -1 ; /* decr writer count x*/ 


if ( semop( semset id, actions, 1) -1) 


oops("semop; unlocking", 10); 
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此 程序 中 ,使 用 信号 量 集 的 服务 器 必须 完成 下 面 的 5 个 步骤 。 

(1) 创建 信号 量 集 

semset id — semget(key t key, int numsems，int flags) | 

semget 函数 创建 了 一 个 包含 numsems 个 信号 量 的 集合 。shm_ts2 程序 创建 了 包含 两 个 
信号 量 的 集合 。 此 集合 所 拥有 的 权限 模式 是 0666。 函 数 semget 返回 此 信和 号 量 集 的 ID, 

(2) 将 所 有 的 信号 量 置 0 

semctl(int semset id, int semnum, int cmd, union semun arg) 

这 里 使 用 semctl 来 对 信号 量 集 进行 控制 。 此 函数 的 第 一 个 参数 是 此 集合 的 ID ,第 二 
参数 是 集合 中 某 特定 信号 量 的 号 码 , 第 三 个 参数 是 控制 命令 。 如 果 此 控制 命令 需要 参数 , 那 
么 使 用 第 四 个 参数 向 其 提供 所 需 的 参数 。 在 shm_ts2 中 ,使 用 SETVAL 命令 来 给 每 一 个 信 
号 量 赋 一 个 初 值 零 。 

(3) 等 待 所 有 读者 完成 任务 之 后 ,服务 器 将 num, writers 加 1 

semop(int semid, struct sembuf x actions, size t numactions) | 

. WX semop 对 信和 号 量 集 完成 一 组 操作 。 第 一 个 参数 用 来 指定 信号 量 集 。 第 二 个 参数 是 
一 组 活动 的 数组 。 最 后 一 个 参数 则 是 该 数组 的 大 小 。 集 合 中 的 每 一 个 活动 都 是 一 个 结构 
体 , 它 的 作用 就 是 “使 用 选项 sem flg 来 完成 对 号 码 为 sem. num 的 信和 号 量 的 操作 sem. op", 
整个 活动 集合 被 作为 组 来 完成 ,这 一 点 是 关键 。 上 面 程序 中 的 函数 wait_and_lock 完成 两 个 
BRE: SRE RAS ,然后 将 写 者 数 加 1. 这 里 建 了 一 个 包含 这 两 个 活动 的 数组 ,活动 0 
所 要 完成 的 事情 就 是 “等 待 信号 量 0 变 成 0”。 而 活动 1 要 完成 的 功能 则 是 “将 信号 量 1 加 
1 。 进 程 挂 起 直到 这 两 个 活动 都 被 完成 。 只 要 读者 计数 器 一 变 成 0, 写 者 计数 器 立即 加 1,25 
后 semop PA ŽUR El, 

使 用 SEM. UNDO 标志 :允许 内 核 在 进程 退出 的 时 候 人 恢复 这 些 操作 。 在 上 面 这 个 程序 
中 , 当 写 者 计数 器 被 加 1 的 时 候 ,共享 内 存 段 是 被 锁 住 的 。 如 有 果 在 对 此 计数 器 做 减 1 操作 之 
前 ,进程 非法 终止 ,其 他 进程 则 永远 无 法 读 取 共 享 内 存 段 的 内 容 了 。 

(4) 对 num writers JX 1 | 

在 release lock 函数 中 ,只 需 完成 一 件 事 情 : 对 写 者 数 减 1。 这 里 使 用 一 个 只 包含 该 活 
动 的 数组 作为 参数 来 调用 semop 函数 ,从 而 完成 对 写 者 数目 的 修改 。 如 果 这 时 菜 客户 正在 
等 得 , 它 立 即 就 可 以 继续 执行 读 操作 了 。 

(5) 删除 信号 量 

semctl(semset id, 0, IPC RMID, 0) 

任务 完成 之 后 ,服务 器 再 次 调用 semctl 函数 ， 不 过 这 次 的 目的 是 删除 信号 量 ， 

4. 客户 端 程序 : shm_tc2.c 

客户 只 的 设计 相对 容易 得 多 。 在 程序 shm_tc 中 , 既 不 初始 化 信号 量 也 不 删除 它们 。 


/* shm tc2.c 一 time client shared mem ver2 : use semaphores for locking 


* program uses Shared memory with key 99 
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* program uses semaphore set with key 9900 


x / 


# include  «stdio.h- 

# include <(sys/shm. h> 

# include <(time.h> 

# include <sys/types.h> 
# include <(sys/ipc.h> 

# include <csys/sem. h> 


# define TIME MEM KEY 99 /* kind of like a port number */ 
# define TIME SEM KEY 9900 /* like a filename x/ 
# define SEG SIZE ((size t)100) /* size of segment x/ 


4 define oops(m,x) | perror(m); exit(x); } 


union semun { int val ; struct semid ds x buf ; ushort * array; }; 


main() 


| 


} 
/* 


int seg id; 
char * mem ptr, x ctime(); 


long now; 
int  semset id; /* id for semaphore set x/ 
/* create a shared memory segment x/ 


seg id - shmget( TIME MEM KEY, SEG SIZE, 0777 ); 
if ( seg id == -1) 
oops("shnget",1); 


/* attach to it and get a pointer to where it attaches x/ 


mem ptr = shmat( seg id, NULL, 0); 
if ( mem ptr == ( void *) -1) 
oops( "shmat",2); 


/* connect to semaphore set 9900 with 2 semaphores x/ 


semset id - semget( TIME SEM KEY, 2, 0); 


wait and lock( semset id ); 
printf("The time, direct from memory; .. 5s", mem ptr); 


release lock( semset id); 
shmdt( mem ptr ); /x detach, but not needed here x/ 


* build and execute a 2 - element action set: 


* wait for 0 on n writers AND increment n readers 


x/ 
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wait and lock( int semset id) 


{ 


/* 
/* 
/* 
/* 
/* 
/* 
/* 
/* 


union semun sem info; 

struct sembuf actions[2]; 

actions[0].sem num - 1; 
actions[ 01. sem flg = SEM UNDO; 
actions| 0]. sem op = 0 ; 
actions|1].sem num - 0; 
actions[1].sem flg = SEM UNDO; 
actions|l].sem op = *1; 

if ( semop( semset id, actions, 2) == -1) 


oops("semop; locking", 10); 

/* 

x build and execute a 1 - element action set, 

* decrement num readers 

*/ 
release_lock( int semset_id ) 

| | 

union semun sem info; 


struct sembuf actions[1]; 


actions| 0].sem num = 0; 
SEM UNDO; 


actions[ 0 ]. sem flg 


actions[0].sem op = -1; 


if ( semop( semset id, actions, 1) == -1) 


oops("semop; unlocking", 10); 


编译 并 对 程序 做 如 下 的 测试 : 


$ cc shm ts2.c - o shmserv | 
$ cc shm tc2.c - o shmclnt 
$ ./shmserv & 
[1] 15533 
shm_ts2 waiting for lock 
shm_ts2 updating memory 
$ shm ts2 released lock 
$ shm ts2 waiting for lock 
shm ts2 updating memory 
$ ./shmclnt 
shm ts2 released lock 


/* 
/* 
/* 
/x 
/* 


some properties x/ 
action set x/ 

sem| 1] is n writers x/ 
auto cleanup x/ 

wait for 0 */ 

sem| 0] is n readers */ 
auto cleanup x/ 


incr n readers x/ 


some properties x/ 
action set x/ 

sem[0] is n readers x/ 
auto cleanup x/ 


decr reader count x/ 


The time, direct from memory; ..Sat Oct 27 17:36:34 2001 


$ shm ts2 waiting for lock 
shm ts2 updating memory 
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S ./shmclnt 
shm ts2 released lock 
The time, direct from memory: ..Sat Oct 27 17:36:40 2001 
S shm ts2 waiting for lock 
ipcs 
一 一 一 一 一 一 Shared Memory Segments 一 一 一 一 一 一 一 一 
key shmid owner perms bytes nattch status 
0x00000063 30670854 bruce 777 100 1 
一 一 一 一 一 一 Semaphore Arrays 一 一 一 一 一 一 一 一 
key shmid owner perms  nsems status 
0x000026ac 262146 bruce 666 2 
| =- Message Queues 一 一 一 一 一 一 


key msqid owner perms used- bytes messages 


$ shm ts2 released lock 
shm ts2 waiting for lock 
S kill - INT 15533 


$ semop; unlocking; Invalid argument 


上 面 对 程 序 的 测试 展示 了 客户 端 如 何等 待 服务 器 解锁 。 许 多 客户 可 以 同时 运行 ,每 一 
客户 等 待 服务 器 计数 器 变化 到 0, 然 后 对 客户 计数 器 加 1。 如 果 三 个 客户 同时 从 共享 内 存 中 
读 取 数 据 , 读 者 计数 器 也 将 是 三 个 。 服 务 器 只 好 等 三 个 客户 的 读者 计数 器 都 变 为 0 时 , 才 可 
以 进行 数据 的 写 操作 。 

程序 中 并 没有 对 可 能 出 现 的 所 有 情况 进行 处 理 。 具 体 来 说 ,如 何 防止 两 个 服务 器 程序 
同时 运行 ? 在 我 们 的 程序 中 ,服务 器 仅仅 等 待 客户 的 读者 服务 器 变 为 0 而 并 没有 对 其 他 服务 
器 的 写 者 计数 器 进行 判断 。 

o. RRIF SEA ER 

客户 端 等 待 着 服务 器 的 写 者 信号 量变 为 零 , 而 同时 服务 器 等 待 着 客户 端的 读者 信和 号 量 
变 为 零 。 但 在 其 他 的 程序 中 ,也 许 希 望 等 待 的 是 某 个 信号 量变 成 正 数 值 。 举 例 来 说 ,也 许 希 
望 等 待 信号 量 的 值 变 为 2。 如 何 来 写 这 样 的 程序 呢 ? 

这 里 使 用 一 个 不 太 直接 的 方法 : 让 系统 内 核对 信号 量 做 减 2 操作 。 信 和 号 量 不 允许 为 负 
值 ,因此 系统 内 核 将 调用 挂 起 直到 信号 量 的 值 大 于 或 等 于 2。 信和 号 量 一 旦 达到 2, 某 进程 就 对 
E iC, 2 操作 ,然后 把 任何 其 他 要 对 这 个 信号 量 减 2 的 进程 挂 起 。 | 

这 个 操作 的 sem op 成 员工 作 方式 如 下 。 

* di sem op 是 正 值 ,活动 : 通过 sem op 函数 对 信和 号 量 减 2。 

。 若 sem op 是 零 ,活动 : 挂 起 直到 信号 量 等 于 0。 

。 若 sem op 是 负 值 ,活动 : 挂 起 直到 信号 量变 成 正 值 。 


15.4.3 socket & FIFO 与 共享 的 存储 


本 章 的 前 面部 分 写 了 四 个 版 本 的 时 间 / 日 期 服务 器 和 客户 端 程序 。socket 版 本 和 FIFO 
版 本 要 相对 容易 些 。 客 户 端 连接 到 服务 器 ,服务 器 发 送 数据 ,然后 服务 器 进程 挂 起 。 虽 然 共 
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享 内 存 和 文件 的 版 本 看 上 去 很 简单 ,但 它们 需要 锁 和 信号 量 机 制 来 保护 数据 。 要 知道 加 入 
锁 和 信号 量 也 是 相当 复杂 的 一 件 事 。 

然而 文件 和 共享 内 存 机 制 允许 多 客户 端 同 时 从 服务 器 读 取 数据 ,人 允许 客户 端 和 服务 器 
在 不 同 的 时 刻 运 行 , 并 且 当 进程 衣 溃 时 ,人 允许 数据 的 保持 和 恢复 。 

管道 和 socket 也 包含 了 锁 的 机 制 。 管 道 和 socket 其 实 也 是 保存 数据 的 内 存 段 , 它 将 数 
据 从 源 端 复制 到 目的 端 。 不 同 的 是 管道 和 socket 中 的 锁 和 信和 号 量 是 由 内 核 , 而 不 是 由 进程 
来 管理 的 。 


15.5 Ff El 池 


在 时 间 / 日 期 程序 中 ,服务 器 发 数据 给 客户 端 。 然 而 另外 的 一 些 程序 却 是 以 截然 不 同 的 
方式 工作 : 多 客户 端 发 数据 给 服务 器 ,例如 打印 服务 器 上 的 打印 池 。 那 么 这 种 类 型 的 程序 如 
何 来 设计 呢 ? 


15.5.1 多 个 写 者 、 一 个 读者 


如 图 15.9 所 示 , 多 用 户 共 享 一 个 打印 机 。 如 何 使 用 客户 端 /服务 器 模型 来 设计 一 个 共享 
打印 机 的 程序 呢 ? 多 个 用 户 可 能 会 在 同时 发 送 打印 请 求 ,但 是 打印 机 在 某 一 时 刻 只 能 打印 
一 个 文件 。 打 印 程序 就 必须 接收 多 个 并 发 的 输入 ,并 将 单个 的 输出 流 送 到 打印 设备 上 。 如 
何 来 写 这 个 服务 器 程序 呢 ? 它 们 之 间 又 如 何 通 信 呢 ? 





一 个 打印 机 。 ”打印 机 任务 队列 ”一 些 同步 的 打印 机 请 求 
图 15.9 多 个 数据 源 .一 个 打印 机 


这 个 程序 由 哪些 功能 单元 组 成 ? 这 些 单元 之 间 又 传递 哪些 数据 和 消息 呢 ? 






printer 


Soh RPh a 
Hr fa 4 " b 
i mier T 7 949 E IS Be ae bry ae Maite ce eee poe 
į mm nest e r Eiri ELLE 
i um S 
Bal” 
图 15. 10 将 一 个 文件 传 给 打印 机 


在 Unix 系统 中 打印 文件 的 最 简单 方法 就 是 使 用 如 下 命令 ， 


cat filename > /dev/lpl 或 者 cp filename /dev/1p1 
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这 里 /devw/lpl 是 打印 机 设备 文件 的 名 称 。 当 然 系统 中 打印 设备 文件 名 称 并 不 一 定 和 上 十 
面 的 一 样 ,但 在 Unix 系统 中 将 数据 传 给 打印 机 或 其 他 设备 的 惟一 方法 就 是 通过 open 打开 
文件 ,然后 使 用 write 系统 调用 将 数据 写 至 打印 文件 中 。 

可 以 使 用 写 数据 锁 吗 ? 

大 家 已 经 学 习 过 写 数据 锁 和 信号 量 机制 了 。 为 什么 不 可 以 自己 写 一 个 cat 或 cp 的 打印 
程序 ,让 它 通过 写 数据 锁 来 防止 对 设备 文件 的 同步 访问 冲突 呢 ? 

基于 锁 机 制 的 文件 复制 程序 确实 没有 问题 。 考 虑 一 下 对 打印 机 加 锁 后 ,结果 会 怎样 。 
若 某 程序 对 打印 机 加 锁 ,其 他 的 文件 复制 程序 都 必须 挂 起 等 待 第 一 个 程序 完成 任务 并 释放 
锁 。 那么 下 一 步 哪个 程序 执行 呢 ? 内 核 将 所 有 挂 起 进程 中 的 一 个 唤醒 ,但 是 这 个 进程 却 不 
一 定 就 是 排 在 第 二 的 。 显 然 这 样 的 决定 有 失 公 平 。 人 允许 用 户 通过 复制 数据 到 打印 设备 文件 
来 实现 打印 还 有 另 一 个 问题 : 车 有 些 人 试图 作假 ,他 们 可 以 不 使 用 这 样 一 个 加 锁 的 程序 来 打 
印 。 第 三 个 问题 则 是 某 些 文件 需要 特殊 的 处 理 。 例 如 图 像 文件 有 可 能 需要 被 转换 为 打印 机 
可 以 看 得 懂 的 图 像 命 令 。 很 多 用 户 并 不 知道 如 何 将 数据 转换 成 通用 的 格式 ,那么 他 们 就 得 
不 到 正确 的 结果 。 然 而 这 所 有 的 问题 都 可 以 由 集中 化 (客户 /服务 器 模式 ) 来 解决 。 


15.5.2 ”客户 /服务 器 模型 


程序 的 客户 /服务 器 模型 解决 了 前 面 提 到 过 的 打印 的 问题 。 只 有 一 种 称 为 线性 打印 精 
灵 (line printer daemon) 的 服务 器 程序 有 权限 去 写 数 据 到 打印 设备 文件 中 ,而 其 他 的 用 户 进 
程 则 不 行 (如 图 15. 11 所 示 )。 当 用 户 需 要 打印 文件 的 时 候 , 他 们 运行 一 个 称 为 lpr 的 客户 端 
程序 。lpr 对 文件 做 了 一 个 复制 ,然后 将 复制 的 文件 放 在 打印 任务 队列 中 。 用 户 可 以 删除 或 
编辑 这 个 文件 。 并 且 打 印 精灵 程序 可 以 将 图 片 和 格式 做 转换 以 使 得 它们 能 够 正确 地 被 打印 
出 来 。 







client 


iren toa aA 

d = 3 às M 

E "Bs 3 T o Tl 

server FS Ws red "d pr L- 
pæ it 4 o BE 


15.11 客户 /服务 器 模型 的 打印 系统 


客户 端 和 服务 器 如 何 通信 呢 ? 它们 交互 哪些 数据 ? 客户 端 将 整个 文件 传 给 服务 器 还 是 
客户 端 仅仅 将 文件 名 传 给 服务 器 呢 ? 如 果 服 务 器 和 客户 不 是 在 同一 台 机 器 上 ,情况 又 将 如 
何 ? 这 是 否 影响 到 对 通信 方式 的 选择 呢 ? 不 同 版 本 的 Unix 中 有 不 同 的 打印 系统 : 有 些 使 用 
socket, 有 些 使 用 命名 管道 ,而 另外 一 些 仅 使 用 fork 和 文件 。 

是 否 使 用 集中 化 的 客户 /服务 器 模式 就 可 以 不 使 用 锁 机 制 来 避免 冲突 了 ? 可 以 把 系统 
设计 成 一 个 通过 构件 进行 通信 和 合作 的 模型 来 打印 一 台 机 器 上 的 文件 ,也 可 以 用 来 打印 
Internet 上 的 文件 。 可 以 将 你 自己 的 思路 和 不 同 版 本 的 Unix 打印 系统 的 设计 思路 做 一 个 
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15.6 纵 观 IPC 


本 章 已 经 介绍 过 各 种 形式 的 进程 间 通 信 方 法 。 下 面 是 一 个 小 结 。 


方 法 


exec/ wait 
environ 
pipe 
kill-signal 
inet socket 
inet socket | 
Unix socket 
Unix socket 
named pipe | 
shared mem 
msg queue 

| files 
variables 
file locks 
semaphores 
mutexes 


link 


内 容 说明 : 
P/C—— 2 /T X5 
Sib 一 一 兄弟 关系 
Unrel 一 一 无 关 进 程 
M 一 一 发 送 消息 





dx 


] 


是 否 可 以 使 用 在 
不 同 机 器 上 


= - 





-b 
He 
小 


不 同 的 线程 





^ 

H 
o 
n 


S 一 一 使 用 读 和 写 的 数据 流 


RR 一 一 随机 读 取 数据 


C 一 一 用 来 使 任务 同步 或 合作 


* 





适当 的 应 用 
不 适当 的 应 用 


? 





NN 一 一 适合 应 用 在 网 络 文件 系统 上 


上 面 的 这 张 表 并 不 包含 贝尔 实验 室 的 网 络 工具 TL 以 及 它 的 后 续 产 


解释 如 下 : 


e Ífork- execv - argv.exit— wait 


HH 
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AT fi Fl — £8 280 và] FH d Ts FE RAT BRA RRA E. Rit 
程 通过 使 用 fork 来 创建 一 个 新 的 进程 。 在 此 新 进程 中 的 程序 可 以 通过 调用 execv 来 运行 新 
的 程序 ,并 传递 给 新 程序 一 组 参数 。 子 进程 通过 使 用 exit 传 回 一 个 返回 值 ,同时 父 进程 使 用 
wait 来 接收 这 个 返回 值 。 

这 一 组 调用 是 面向 消息 的 ,它们 仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 使 用 。 

。 environ 

系统 调用 exec 通过 一 个 叫做 environ 的 系统 全 局 变量 自动 将 一 组 字符 串 复制 进 新 的 程 
序 中 。 此 方法 允许 进程 传 值 给 子 进程 。 由 于 整个 环境 被 复制 给 子 进程 , 子 进程 无 法 改变 父 
进程 的 运行 环境 。 | 

此 方法 也 是 面向 对 象 的 . 单 向 的 ,仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 上 使 用 。 

* pipe 

管道 是 由 进程 创建 的 单 向 数据 流 。 它 包含 连接 到 内 核 上 的 文件 描述 符 。 写 进 一 个 文件 
描述 符 的 数据 可 以 从 另 一 个 文件 描述 符 读 出 来 。 如 果 进 程 在 创建 管 iB CURRERE T fork, 那么 
新 的 进程 就 可 以 通过 同样 的 管道 读 写 数据 。 

此 方法 是 面向 流 的 ,通常 为 单 向 传输 ,也 仅仅 可 以 使 用 在 相关 的 进程 中 , 且 只 能 在 单机 
上 使 用 。 

e kill-signal 

信和 号 (signal) 是 一 条 从 一 个 进程 发 往 另 一 个 进程 的 整 型 消息 (使 用 kill 系统 调用 ) 。 接 收 进 
程 可 以 通过 使 用 signal 系统 调用 来 安排 一 个 处 理 者 函数 ,此 函数 在 信号 到 来 的 时 候 被 调用 。 

此 方法 是 面向 消息 的 , 某 一 时 刻 单 向 的 ,进程 必须 拥有 相同 的 用 户 ID, 且 只 能 在 单机 上 
使 用 。 | | | | 

* [nternet sockets 

Internet sockets 是 这 样 一 条 链接 , 它 的 两 个 端点 是 通过 特定 的 端口 号 建立 起 来 的 。 字 
T WE socket 进行 传输 ,从 一 个 进程 到 达 另 一 个 进程 ,类 似 于 某 人 在 波士顿 打 电 话 给 在 东 
ARE E. Internet sockets 有 两 种 主要 的 实现 方式 : Vi socket 和 数据 报 socket, XMH y 
可 以 双 四 传输 。 流 socket 更 类 似 于 文件 描述 符 ; 程序 员 使 用 write 和 read 调用 来 发 送 和 接 
收 数据 。 数 据 报 socket 则 类 似 于 明信片 : 写 者 将 缓存 中 的 一 块 数据 发 给 读者 。 所 有 的 交互 
都 是 以 数据 缓存 的 形式 完成 ,而 不 是 字 节 流 。 

有 面向 消息 和 面向 流 两 个 版 本 ,双向 传输 ,可 以 在 无 关 进 程 中 使 用 ,可 以 通过 网 络 传输 
数据 。 

* Named Sockets 

命名 socket, X. £& Unix J8 socket, 它 使 用 文件 名 作为 地 址 而 不 是 主机 名 一 端口 号 对 。 
命名 socket 同时 支持 流 和 数据 报 版 本 。 因 为 这 种 方式 使 用 文件 名 而 不 是 主机 一 端口 作为 地 
址 ,所 以 它们 仅仅 可 以 连接 同一 机 器 上 的 进程 。 

这 种 方法 有 面向 消息 和 面向 流 两 个 版 本 ， 双向 传输 ,可 以 在 无 关 进 程 中 使 用 ， 只 能 工作 
在 单机 上 。 

* Named Pipes(FIFOs) 

命名 管道 的 工作 方式 类 似 于 一 个 常规 管道 ,但 是 它 可 以 连接 两 个 无 关 的 进程 。 命 名 管 
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道 由 文件 名 来 标志 。 写 者 使 用 open 调用 来 打开 文件 并 写 数据 ,读者 同样 使 用 open 调用 打开 
文件 读数 据 。 这 种 方法 比 命名 socket 使 用 起 来 方便 很 多 ,但 是 它 只 可 以 单 向 传输 。 

此 方法 是 单 向 传输 的 .面向 流 的 ,可 以 连接 无 关 进 程 , 只 能 工作 在 单机 上 。 

* File Locks 

Unix 允许 进程 对 文件 的 访问 设置 锁 。 进 程 可 以 对 文件 的 某 一 段 加 锁 , 使 自己 可 以 单独 
地 对 这 一 段 进行 改动 。 男 一 个 试图 锁 住 此 文件 的 进程 将 被 挂 起 ,直到 这 个 文件 被 解锁 。 文 
件 锁 机 制 允 许 进程 间 进行 通信 ,让 所 有 的 进程 都 知道 是 哪 一 个 进程 正在 读 取 或 修改 文件 。 
这 里 可 以 使 用 系统 调用 flock、lockf 和 fcntl 来 设置 或 测试 文件 锁 。 在 某 些 系统 中 , 这些 锁 是 
被 强制 加 上 的 。 

这 种 方法 面向 消息 ,多 个 无 关 进程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 . 

e Shared Memory 

每 个 进程 都 有 其 自己 的 数据 空间 。 程 序 所 定义 的 任何 变量 或 在 运行 时 刻 分 配 的 空间 都 

只 有 对 该 进程 是 可 见 的 。 进 程 可 以 通过 使 用 shmget 和 shmat 调用 来 创建 可 以 被 多 个 进程 

共享 的 内 存 段 。 由 一 个 进程 写 人 共享 内 存 段 的 数据 可 以 被 别 的 对 此 内 存 段 有 访问 权限 的 进 
程 读 出 。 这 是 IPC 中 最 为 有 效 的 一 个 方法 ,因为 所 有 的 通信 并 不 需要 数据 的 传输 。 

此 方法 面向 随机 访问 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 。 

* Semaphores 

信号 量 是 系统 级 的 变量 ,程序 之 间 可 以 通过 信和 号 量 来 进行 通信 。 进 程 可 以 对 信号 量 做 
增 1 操作 , 减 1 操作 或 等 待 信号 量 到 某 个 特定 的 值 。 信 号 量 类 似 于 许可 证 服务 器 上 的 许可 
证 。 当 进程 需要 使 用 资源 的 时 候 , 它 对 信号 量 做 减 1 操作 ( 取 一 个 许可 证 )。 如 果 此 时 许可 证 
已 经 用 完了 ,进程 挂 起 直到 其 他 进程 对 信和 号 量 做 了 增 1 操作 。 信 和 号 量 应 用 在 各 种 各 样 的 程 
HR. 

此 方法 是 面向 消息 的 ,多 个 无 关 进 程 间 可 以 同时 交互 ,但 只 能 在 单机 上 工作 。 

* Message Queues 

消息 队列 的 工作 原理 类 似 于 FIFO, 但 它 并 不 是 以 文件 名 来 标志 。 进 程 可 以 将 消息 加 到 
队列 中 ,然后 由 其 他 进程 将 数据 从 队列 中 取出 。 多 个 队列 可 以 被 多 个 进程 所 共享 。 

这 种 方法 是 面向 消息 的 、 单 向 传输 的 , 且 只 能 工作 在 单机 上 、。 

* Files 

文件 可 以 被 多 个 进程 在 同一 时 刻 打 开 。 如 果 某 进程 将 数据 写 入 一 个 文件 ,另外 的 进程 
可 以 从 该 文件 中 读 出 数据 。 若 大 家 都 使 用 一 个 经 过 巧妙 设计 的 交互 协议 ,很 多 复杂 的 通信 
都 可 以 通过 古老 的 文件 机 制 来 实现 。 

此 方法 面向 随机 访问 ,多 个 无 关 进程 间 可 以 同时 交互 ， 网 络 文件 系统 (NFS) 可 以 支持 跨 
机 器 的 多 进程 通信 。 


15.7 连接 与 游戏 


本 章 介 绍 了 很多 进程 之 间 传递 数据 的 方法 Unix 的 系统 内 核 管理 着 进程 .文件 和 设备 ， 
并 且 对 管道 ,socket .文件 .共享 内 存 以 及 信号 进行 操作 使 它们 可 以 传输 数据 。 对 于 某 些 程序 
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来 说 ,创建 和 管理 连接 与 数据 的 传输 是 最 主要 的 部 分 。 

Unix 的 开发 者 之 一 Ken Thompson, Æ 1978 年 写 道 : 

“与 其 说 Unix 的 内 核 是 一 个 完整 的 操作 系统 ,还 不 如 说 它 是 个 I/O 多 路 复 用 器 
(multiplexer) 。 从 这 种 观点 出 发 ,许多 其 他 操作 系统 中 的 特征 在 Unix 内 核 中 是 找 不 到 的 
eee 这 许多 的 功能 都 是 由 用 户 程序 使 用 内 核 调用 来 实现 的 .2” 

在 第 1 章 中 ,讨论 了 命令 bc、 一 个 Web 服务 器 还 有 一 个 网 络 桥牌 游戏 。 接 着 写 了 一 
bc 程序 和 两 个 Web 服务 器 程序 。 那 么 如 何 写 网 络 桥牌 游戏 呢 ? 可 以 使 用 屏幕 控制 程序 来 
作为 用 户 界面 ,使 用 socket 来 连接 两 端 。 那 么 哪 一 端 是 服务 器 ? 哪 一 端 是 客户 呢 ?” 如 何 使 
用 锁 机 制 ? 你 所 需要 的 所 有 的 技术 都 包含 在 本 书 的 章节 中 。 在 Unix 上 进行 编程 并 没有 想 
象 中 的 那么 难 , 可 是 也 并 非 是 一 件 容 易 的 事 。 

说 到 游戏 和 网 络 , 让 我 们 回忆 一 下 Dennis Ritchie 是 如 何 来 描述 用 来 引 出 Unix 的 空间 
探险 游戏 的 : 

“ “最 开始 写 在 Multics 系统 上 ……: ,这 并 不 亚 于 对 太阳 系 诸 星体 运动 的 模拟 ， 你 还 必须 
让 玩家 驾驶 着 太空 船 四 处 巡视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 卫星 上 登录 。” 

驾驶 着 太空 船 四 处 巡视 ,观看 空间 的 景色 并 且 可 能 在 行星 或 其 卫星 上 登录 不 就 像 生活 
中 的 网 络 冲 浪 一 样 吗 ?可 能 冲浪 并 不 是 最 好 的 比喻 。 但 是 确实 人 们 打开 他 们 的 浏览 器 ,到 
全 世界 四 处 浏览 ,Web 服务 器 将 各 处 的 景象 返回 。 人 们 使 用 telnet、ssh 还 有 ftp 登录 到 其 他 
机 器 上 。 也 许 Internet 恰巧 就 是 Ritchie e Thompson 在 1969 EF aR ES AY BAS [8] AY SC 
现 吧 1! 


小 BR 


1. 主要 内 容 

许多 程序 都 包含 一 个 或 多 个 进程 ,进程 间 通 过 共享 数据 或 传递 数据 进行 通信 。 举 例 
来 说 ,两 个 人 通过 使 用 Unix 的 talk 命令 进行 对 话 ， 他 们 就 运行 了 两 个 进程 ， 将 数据 
从 键盘 和 socket 传输 到 屏幕 和 socket。 

某 些 进程 需要 从 多 个 源 端 接收 数据 ,并 将 数据 送 到 多 个 目的 地 。select 和 poll HFA Ft 
省 进程 等 待 多 个 文件 描述 符 的 输入 。 

Unix 提供 了 许多 方法 来 进行 数据 在 进程 间 传 输 。 命名 管道 和 共 CEA fF te lel — OL at 
上 的 进程 间 通 信使 用 的 两 种 技术 。 通 信 方 法 的 区 别 在 于 它们 的 速度 .所 传输 的 消息 
类 型 .所 需 的 范围 限制 访问 权限 的 能 力 以 及 防止 数据 冲突 的 能 力 。 | 

文件 锁 是 进程 间 使 用 的 避免 对 文件 访问 冲突 的 技术 。 

信和 号 量 是 进程 合作 时 所 使 用 的 系统 级 的 变量 。 进 程 挂 起 等 待 另 一 一 进程 改变 信号 量 
的 值 。 

2. 下 一 步 做 什么 

学 习 Unix 系统 编程 的 最 好 的 办 法 就 是 不 断 的 读 程序 , 写 程序 。 大 家 可 以 在 网 上 找到 大 


. 


D “Unix Implementation" Bell System Technical Journal, vol. 56, no. 6. 1978. 





«494 * 


量 的 信息 





Unix/Linux 编程 实践 教程 


,以 及 介绍 Unix 内 部 实现 和 编程 接口 的 书籍 。 大 家 多 注意 一 下 每 天 都 使 用 的 程序 


还 有 一 些 吸 引 你 的 新 程序 。 通 过 使 用 .学习 ,并 且 经 常 自己 来 实现 一 些 已 经 存在 的 程序 ,就 
HAER. EH. E ie Tø Unix 的 编程 了 。 
3. 习题 


15.1 


在 talk 程序 中 ,为 何不 用 线程 从 文件 描述 符 中 读 取 数据 呢 ? 一 个 线程 可 以 从 键 
BÉ 读 取 数据 ,而 另 一 线程 从 socket 读 取 数 据 。 契 程 序 由 多 线程 方案 来 实现 ,会 出 
现 哪些 新 闻 题 呢 ? 


15.2 talk 程序 在 大 多 数 的 时 候 都 是 在 读 写 单个 字符 ,但 在 传输 数据 的 时 候 使 用 的 是 数 
据 流 。 使 用 数据 报 socket 的 优 缺 点 各 是 什么 ? 
15.3 基于 FIFO 的 时 间 服 务 器 在 执行 到 date > /tmp/time fifo 的 时 候 挂 起 直到 某 一 
2r Pity FIFO 来 读 取 数据 。 若 服务 器 挂 起 的 时 间 很 长 ,客户 端 是 在 服务 器 挂 
起 时 能 够 接收 到 时 间 还 是 在 服务 器 被 览 醒 的 时 候 能 接收 到 时 间 ? 为 什么 ? 
15.4 看 一 下 系统 调用 mmap。mmap 将 文件 的 某 一 段 模拟 成 内 存 中 的 一 个 数组 ,从 而 
允许 程序 不 使 用 lseek 就 可 以 对 文件 进行 随机 的 访问 。 使 用 mmap 与 使 用 文件 
或 共享 内 存 的 方式 来 实现 进程 间 通 信 有 何 区 别 ? 和 别 的 方法 相 比 ,使 用 mmap 
又 有 何 优 缺 点 ? 
15.5 talk 中 包含 了 两 个 相连 的 进程 。 使 用 一 下 talk ,看 一 看 连接 是 如 何 建 立 的 ? 其 中 
又 包含 了 哪些 程序 呢 ? 
4. 编程 练习 
15.6 参考 select 和 poll 调用 的 使 用 手册 ,看 看 你 的 系统 中 是 否 都 支持 。 在 有 些 系 统 
中 ,其 中 一 个 是 真 的 系统 调用 ,而 另外 一 个 则 是 由 那个 真 的 系统 调用 模拟 出 来 
的 。 使 用 poll 来 重 写 程序 selectdemo. c. | 
15.7 编写 使 用 下 列 方法 的 时 间 / 日 期 服务 器 和 客户 端 程序 。 
(1) 使 用 IP 地 址 的 数据 报 socket, 
(2) 使 用 Unix 域 地 址 的 流 socket, 
15.8 编写 基于 FIFO 的 时 间 / 日 期 服务 器 和 客户 端 程序 。 


15.9 


多 个 共享 内 存 的 服务 器 : 

(1) 可 以 在 同一 时 刻 运 行 两 个 共享 内 存 的 服务 器 吗 ? 为 什么 ? 做 一 下 试验 ，。 

(2) 修改 服务 器 程序 中 的 wait and lock 函数 ， 使 服务 器 可 以 扶 起 等 待 直到 运行 
的 服务 器 数目 变 为 0。 


15.10 在 使 用 文件 的 版 本 中 ,用 文件 锁 来 保护 对 共享 文件 的 访问 重 写 此 程序 ,用 信 


号 量 来 代替 文件 锁 。 


15.11 在 使 用 共享 内 存 的 版 本 中 ,用 信号 量 来 保护 对 共享 内 存 的 访问 。 重 写 此 程序 ， 
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用 文件 锁 来 替代 信号 量 。 当 然 这 时 需要 一 个 共享 的 文件 。 


若 用 户 太 多 ,共享 内 存 的 信和 号 量 解决 方案 就 无 法 报告 正确 的 结果 。 考 虑 一 下 这 
样 的 模式 : 读者 A 将 读者 计数 器 增 至 1。 接 下 来 ,读者 B 将 读者 计数 器 增 至 2。 
这 时 ,读者 A 已 经 读数 据 完 毕 , 将 读者 计数 器 减 1 ,但 读者 C 又 将 计数 器 增 1, 
因此 读者 计数 器 这 个 时 候 仍 为 2。 之 后 ,读者 B 结束 ,A 重 来 ,C 结束 ,然后 了 又 
重 来 ……。 因 此 无 论 什 么 时 候 , 共 享 内 存 都 在 被 读 取 。 解 释 一 下 为 什么 这 种 情 
况 阻止 了 写 者 更 新 时 间 。 修 改 此 系统 ,使 得 写 者 可 以 防止 新 的 读者 锁 住 共享 内 
存 段 。 


编写 一 个 cp 命令 的 新 版 本 打印 机 程序 。 它 使 用 写 数 据 锁 来 防止 对 输出 文件 的 
同步 访问 冲突 。 在 你 的 机 器 上 使 用 这 个 程序 同时 打印 两 个 文件 : 


printcp filel /dev/lpl & printcp file2 /dev/lpl& 


